Next: 関連研究
Up: soturon2
Previous: 図目次
目次
近年,インターネット上で様々な電子テキストが増加し,これらの電子テキストから有益な情報を取り出す技術が望まれている.
大竹ら[1]は,電子テキストから特定のキーワードに基づく関係情報をネットワークとして抽出する方法を提案し,「地震」というキーワードに基づいて単語ネットワークの構築を行った.
土遠ら[2]は,大竹らが構築したネットワークに関連のない事物のノードを含むことを確認し,それらのノードを削除を行った.
窪ら[3]は,ノード同士の関係を示す情報としてリンクに文字列の付与を行った.
しかし,これらは複数文書を入力とした場合における,発想支援を目的とした研究であり,一連した内容について書かれている単一文書に対しては適用できないということがあった.
そこで本研究では,単一文書を入力とした単語ネットワークを構築する手法を提案する.
単一文書を単語ネットワークとして可視化することで,文書を読む手間を省くことができる.
本研究の目的は,単一文書を入力として単語ネットワークを構築することにより,読書支援に役立てることである.
本研究の主張点を以下に示す.
- 単語ネットワークの入力として単一文書を用いることが想定されていないという問題を解決するために,システム改良により単一文書を入力として単語ネットワークの構築をする.
- 単一文書の「新聞記事」を入力として単語ネットワークを構築し,単語ネットワークの第2階層に出現した単語を含む段落を3つ抽出した場合,入力データ全体の約44%の読書量で,約44%の内容を把握できることを確認した.ランダムで段落を3つ抽出した場合は,読書率約42%に対して正解率32%となり,正解率の向上を確認できた.
- 「小説」を入力として単語ネットワークを構築し,本文中における出現箇所を調査し,正規分布において約95%の範囲に単語ネットワーク構築に用いた単語が約98%の確率で出現することを確認した.これにより,登場人物やある事柄など,単語ネットワークでノードとして出力されている単語の出現段落の推定が可能となった.
- 「小説」を入力として単語ネットワークを構築し,ノード対の有用性について調査し,入力データとして用いた6つの小説の全てで,5つ以上の有益なノード対が獲得できることを確認した.これにより,登場人物の特徴,2人の登場人物の関係性,物語における有益な情報のいずれかを獲得することができる.特に登場人物についての情報が多く獲得できたため,物語の大枠を捉えられる可能性から,読書支援にも有効であると考えられる.
本論文の構成は以下の通りである.
第2章では,本研究の関連研究を述べ,
第3章では,本研究の基本となるネットワーク構築の流れ及び文字列の付与手法について述べる.
第4章では,単一文書を入力とした場合の単語ネットワーク構築手法を提案する.
第5章では,実験条件,実験結果,評価方法,評価結果を述べる.
第6章では,結果の考察と今後の課題を述べる.
第7章では,本論文のまとめを述べる.
s112054
2017-03-03