next up previous contents
Next: ノード対の有用性の考察 Up: 考察 Previous: 内容把握についての考察   目次

単語の出現範囲の考察

単語の出現範囲についての考察を行う. 95%の信頼値で出現範囲を求めると,出現範囲内に平均で約98%の確率で単語が出現することを確認できた.

また,標準偏差の値が低いほど,推定する出現範囲が狭くなることを確認した. 例えば,表5.7の「ヨシ子」という単語は標準偏差が62.79で推定した出現範囲が第592段落から第837段落となっている.全段落数が829段落であるので物語の後半で登場することがわかる.図6.1は実際に出現段落を調査した結果である.TF-IDFの値を用いて重要度を算出しているため,TF-IDF上位5単語に含まれる「ヨシ子」はこの物語において重要である人物であると考えられる.

また,表5.4の「小林」などの標準偏差の値が高く,平均値が全段落数の中心値に近い場合は,物語の重要人物の中でも,最初から最後まで多く登場している人物であると予測できる.図6.2は実際に登場人物「小林」の出現段落を調査した結果である.

6.1,図6.2は対象の単語が出現した段落を1とした場合の分布である.図の横軸は段落番号を示す.

以上の結果から,登場人物やある事柄など,単語ネットワークでノードとして出力されている単語の出現段落の推定が可能となることが確認できた.

今後の課題として,登場人物についての情報を提示し,登場段落での行動などが把握できれば読書支援に役立つと考えられる.そのためには,名詞のみをノードとして単語ネットワークに出力するだけでは,情報に偏りが出る可能性があるため,動詞や形容詞といった他の品詞をノード候補にすることが考えられる.





図 6.1: 小説「人間失格」における登場人物「ヨシ子」の出現段落の分布
27#27














図 6.2: 小説「怪人二十面相」における登場人物「小林」の出現段落の分布
28#28



s112054 2017-03-03