Next: 関連研究
Up: soturon2
Previous: 図目次
目次
近年,電子テキストの増加により,膨大なテキストデータから情報を得る機会が増えている.その際に,膨大なテキストデータから有用な情報を取り出す技術が必要とされる.
大竹ら[9]は,物の関係情報をネットワークとしてまとめたものを社会構造モデルと呼び,情報抽出の技術を用いて社会構造モデルを自動で構築した.窪[2]は,新聞文書群において単語間の文字列を用い,単語間の関係を示す文字列を抽出した.そして,単語ネットワークの作成後,ネットワークのリンクにノード同士の関係性を示す文字列の付与を行った.土遠[9]は,テキストデータを用いたネットワークの作成の際の,ノード(単語)の選定処理を改良した.作成されたネットワークに無関係なノードを含むことを問題点として,無関係なノードの削除を行った.しかし,先行研究では新聞の情報不足により,情報量が不十分なネットワークが作成される場合があった.
そこで本研究では,検索エンジンを用いて単語ネットワークの作成を行う.ネットワークの主となる概念をテーマキーワードとして設定し,テーマキーワードに関する情報を検索エンジンで収集する.そして,収集したテーマキーワードに関する情報をもとにネットワークを作成する.これにより,幅広いテーマキーワードで情報量が十分なネットワークを作成できる.
本研究の主張点を以下に示す.
- 新聞を用いて単語ネットワークを作成した場合,新聞の情報不足によって情報量が不十分なネットワークが作成される場合がある.そのため,検索エンジンを用いてネットワークを作成する.
- 新規で内容把握や発想支援に役立つとされるノードに着目して,評価を行う.また,Webの要約文であるスニペットも評価に用いる.
- 検索エンジンを用いた提案手法により20個のテーマキーワードでネットワークを作成した結果,作成したネットワークのうち,約8割のネットワークが情報取得に効果的であることが確認できた.また,新聞を用いた場合に十分なネットワークが作成できなかった8個のテーマキーワードのうち,6個のテーマキーワードで検索エンジンを用いた提案手法で情報取得に十分とされるネットワークが作成できた.さらに,検索エンジンを用いた提案手法では,新聞を用いた場合には見られなかったノードが多く見られた.
- DFの計算に使用するデータを変更し,ネットワークに出現するノードの調査を行った.また,どのデータをDFの計算に使用することがネットワークの作成に適しているかを確認する評価も行った.調査の結果,2016年10月までのWikipediaのデータがネットワークの作成に適していることが確認できた.
- ネットワークの作成後,使用者が興味をもったノードや興味のある単語をアンドテーマキーワードとする.そして,テーマキーワードとアンドテーマキーワードでアンド検索を行い,ネットワークを再度作成した.これにより,使用者にとって興味深いネットワークやアンドテーマキーワードに沿った内容のネットワークを作成できる.作成したネットワークを評価したところ,6割のネットワークが情報取得に効果的であることが確認できた.また,アンドテーマキーワードに関わるノードが多く出現し,テーマキーワードのみを用いたネットワークでは得られない情報が得られた.
本論文の構成は以下の通りである.
第2章では,本研究の関連研究を述べ,
第3章では,先行手法を述べ,
第4章では,提案手法を述べる.
第5章では,実験条件と実験結果や評価方法と評価結果を述べる.
第6章では,実験の結果の考察と,研究の今後の課題を述べる.
第7章では,本研究のまとめを述べる.
2017-04-20