小説を使用した推定実験の結果を表4.26に示す.
サポートベクトルマシン法を用いて新聞記事で段落分割を行った結果,段落分割の推定精度はベースラインの正解率が0.8492に対して,学習データが58#58の場合の正解率は0.8652で最も高い数値であった.
また表4.26の結果をもとに,「ベースラインは正解であるが提案手法は不正解であった分割箇所」の数と,「ベースラインは正解であるが提案手法は不正解であった分割箇所」の数と「ベースラインは不正解であるが提案手法は正解であった分割箇所」の数の合計数を用い,二項分布に基づく有意水準0.05の符号検定(片側検定)を行った.有意差検定で得たp値を表4.27に示す.
表4.27より,55#55と55#55+63#63の正解率はベースラインに対して有意差がなく,他は有意差があった.
また,55#55の正解率と表4.26より55#55のみを除くそれぞれの正解率に対して,有意差を検定した.「55#55は正解であるが提案手法は不正解であった分割箇所」の数と,「55#55は正解であるが提案手法は不正解であった分割箇所」の数と「55#55は不正解であるが提案手法は正解であった分割箇所」の合計数を用い,二項分布に基づく有意水準0.05の符号検定(片側検定)を行った.有意差検定で得たp値を表4.28に示す.
表4.28より,58#58と58#58+65#65は55#55に対して有意差があった.新聞記事と違って他の段落情報の追加が55#55に対して有意差がないことから,小説に対してサポートベクトルマシン法を用いて段落分割をする際,文間箇所の直前直後2文の全単語を追加することは,推定精度の向上に役立っていることが分かる.
新聞記事に対しての段落分割で58#58のみの正解率はベースラインを下回っているが,新聞記事,小説に共通して,文間箇所の直前直後2文の全単語を追加することは,推定精度の向上に役立つと考えられる.