実験結果(新聞記事)

新聞記事を用いた実験では，学習データに2007年の毎日新聞(文間数2,500，5,000，10,000)，テストデータに2008年の毎日新聞(文間数10,000)のデータを用いて実験を行った．テストデータの各段落における文数を表したヒストグラムを図4.1に，テストデータの分類先の頻度を表4.2に，結果を表4.3に示す．

**Figure 4.1:** 新聞記事のヒストグラム
71#71

**Table 4.2:** 分類先の頻度
分割位置	3,257
分割位置ではない箇所	6,743
合計	10,000

**Table 4.3:** 最大エントロピー法(新聞記事)の実験結果
	正解率
素性	2,500	5,000	10,000
55#55	0.6866	0.6900	0.6905
55#55+60#60	0.6894	0.6913	0.6919
55#55+63#63	0.6907	0.6928	0.6935
55#55+65#65	0.7384	0.7428	0.7430
58#58	0.6857	0.6930	0.6959
58#58+65#65	0.7486	0.7594	0.7644
59#59	0.6813	0.6898	0.6956
59#59+65#65	0.7484	0.7556	0.7628
ベースライン	0.6743

新聞記事で段落分割を行った結果，段落分割の推定精度はベースラインの正解率が0.6743に対して，65#65に関する素性以外で考えると，学習データが文間数10,000の58#58の正解率0.6959が最も高い数値であった．表4.3の結果をもとに，「ベースラインは正解であるが提案手法は不正解であった分割箇所」の数と，「ベースラインは正解であるが提案手法は不正解であった分割箇所」の数と「ベースラインは不正解であるが提案手法は正解であった分割箇所」の数の合計数を用い，二項分布に基づく有意水準0.05の符号検定(片側検定)を行った．有意差検定で得たp値を表4.4に示す．

**Table 4.4:** ベースラインとの有意差検定(MEMの新聞新聞)
素性	p値
55#55	0.000322
55#55+60#60	0.000091
55#55+63#63	0.000022
55#55+65#65	3.00575572#7273#73
58#58	0.000002
58#58+65#65	2.34802872#7274#74
59#59	0.000002
59#59+65#65	7.32923772#7275#75

表4.4より，それぞれの素性は全てベースラインの正解率と有意差があった．

また文間数10,000の55#55の正解率0.6905と，表4.3より55#55のみを除くそれぞれの文間数10,000の正解率に対して，「55#55は正解であるが提案手法は不正解であった分割箇所」の数と，「55#55は正解であるが提案手法は不正解であった分割箇所」の数と「55#55は不正解であるが提案手法は正解であった分割箇所」の合計数を用い，二項分布に基づく有意水準0.05の符号検定(片側検定)を行った．有意差検定で得たp値を表4.5に示す．

**Table:** 76#76との有意差検定(MEMの新聞新聞)
素性	p値
55#55+60#60	0.263935
55#55+63#63	0.059962
55#55+65#65	2.39292972#7277#77
58#58	0.085289
58#58+65#65	1.21427272#7278#78
59#59	0.114856
59#59+65#65	7.99319272#7279#79

表4.5より，65#65の段落情報追加を含む素性以外有意差がなかった．しかし，55#55+63#63のp値は有意差はないが，0.05にかなり近い．

また表4.3より，ベースラインと比較すると最も数値の差が大きい58#58+65#65は，ベースラインより0.0901大きい．しかし，他に全単語と以外で追加した60#60と63#63は追加前と比較すると推定精度は向上しているが，数値はほとんど変わらない．

表4.3より，他の手法と比べて65#65の段落情報の追加での正解率がかなり高い理由は，直前直後の正確な段落有無が分かっているからである．図4.1より新聞記事の場合2，3文に1つ段落があることが分かる．もし文間箇所の直前の文頭に段落がある場合，文間箇所は段落ではない可能性が高いと容易に考えられる．