next up previous contents
Next: 謝辞 Up: soturon2 Previous: ノード対の有用性の考察   目次

おわりに

先行研究では,大竹ら[1]は,電子テキストから特定のキーワードに基づく関係情報をネットワークとして抽出する方法を提案し,「地震」というキーワードに基づいて単語ネットワークの構築を行った. 土遠ら[2]は,大竹らが構築したネットワークに関連のない事物のノードを含むことを確認し,それらのノードを削除を行った. 窪ら[3]は,土遠ら[2]が構築したネットワークのリンクに文字列を付与することで,ノード間の関係を分かりやすくした. しかし大竹ら,土遠ら,窪らが構築したネットワークは,複数文書のみを扱う手法で,単一文書の入力には対応していないという問題があった.

そこで本研究では,単一文書を入力とした単語ネットワークを構築する手法を提案した.

その結果,単一文書を入力として単語ネットワークを構築し,単一文書を可視化させることができた.

また,単一文書を入力として構築された単語ネットワークの利用について,内容把握度と単語の出現範囲の推定,ノード対の有用性で評価を行った.

内容把握度について,2階層目の5つのノードにおいて,段落の出現回数頻度上位3つ用いた場合には,約44%の読書率で約44%の正解率を確認した.読書率に対する正解率の割合が1.00となり,ランダムで段落を3つ抽出した場合の割合が0.83であることから,提案手法で抽出した段落を読んだ方が,内容の把握度が高くなることが確認できた.

単語の出現範囲の推定について,95%の信頼値の正規分布に基づいているとして,約98%の確率で単語が区間内に出現することを確認した.これにより,登場人物やある事柄など,単語ネットワークでノードとして出力されている単語の出現段落の推定が可能となった.

ノード対の有用性について,小説を入力とした単語ネットワークにおいて,6つの小説の全てで,5つ以上の有益なノード対が獲得できることを確認した.これにより,登場人物の特徴,2人の登場人物の関係性,物語における有益な情報のいずれかを獲得することができる.特に登場人物についての情報が多く獲得できたため,物語の大枠を捉えられる可能性から,読書支援にも有効であると考えられる.

今後は,単一文書を入力として単語ネットワークを構築する際,動詞や形容詞の重要な単語が存在する場合も考えられるため,様々な品詞をノードとして獲得できるよう改良したい.また,名詞連続の単語を連結することで,単語ネットワークとしての利便性を向上させたい.



s112054 2017-03-03