next up previous contents
次へ: 今後の課題 上へ: 小説を用いた段落の順序推定 戻る: 実験結果   目次

実験の考察

9.4を見ると, 正解率が全体的に低く, 7.3.1節内の新聞記事を用いた場合に比べて大きな性能差が見られた.

小説内の段落の順序推定において, 2値分類にかかわらずCaseIで正解率がランダムの場合の正解率の0.5より低い値になるのは学習データの不足と考える. CaseIは 章内の先頭2段落のみの対を用いてデータを作成するため, 1つの章からは正順と逆順の2組の事例が作成される. このため,11章からなる作品を1つ用いた場合に22事例のデータしか扱うことができない. この学習データの不足に対する解決法として, 複数の作品を用いる場合がある. 5つの作品を用いることで100事例以上の学習データが作成可能となり, 用いる作品を増やすことにより学習データの不足を補うことができると思われる.

また,小説を用いた場合の提案手法の正解率が全体的に低い値であることは 小説を用いた段落の順序推定では新聞記事での特徴が有用でなかったと考える. 新聞は記事内で内容が完結するのに対し, 小説は章ごとに流れがあるため, 小説を用いる場合は前の章の情報も特徴として用いることで, 章内の段落の順序を推定できると思われる.



平成27年3月4日