next up previous contents
Next: 目次 Up: soturon2 Previous: soturon2   目次

概要

近年,電子テキストの増加により,膨大なテキストデータから情報を得る機会が増えている.その際に,膨大なテキストデータから有用な情報を取り出す技術が必要とされる.

大竹ら[9]は,物の関係情報をネットワークとしてまとめたものを社会構造モデルと呼び,情報抽出の技術を用いて社会構造モデルを自動で構築した.窪[2]は,新聞文書群において単語間の文字列を用い,単語間の関係を示す文字列を抽出した.そして,単語ネットワークの作成後,ネットワークのリンクにノード同士の関係性を示す文字列の付与を行った.土遠[9]は,テキストデータを用いたネットワークの作成の際の,ノード(単語)の選定処理を改良した.作成されたネットワークに無関係なノードを含むことを問題点として,無関係なノードの削除を行った.しかし,先行研究では新聞の情報不足により,情報量が不十分なネットワークが作成される場合があった.

そこで本研究では,検索エンジンを用いて単語ネットワークの作成を行う.ネットワークの主となる概念をテーマキーワードとして設定し,テーマキーワードに関する情報を検索エンジンで収集する.そして,収集したテーマキーワードに関する情報をもとにネットワークを作成する.これにより,幅広いテーマキーワードで情報量が十分なネットワークを作成できる.

実際に20個のテーマキーワードでネットワークを作成し,新規で内容把握や発想支援に役立つとされるノードに着目して,評価を行った.評価の結果,作成したネットワークのうち,約8割のネットワークが情報取得に効果的であることが確認できた.また,新聞を用いた場合に十分なネットワークが作成できなかった8個のテーマキーワードのうち,6個のテーマキーワードは検索エンジンを用いた提案手法で情報取得に十分とされるネットワークが作成できた.さらに,検索エンジンを用いた提案手法では,新聞を用いた場合には見られなかったノードが多く見られた.

しかし,作成したネットワークのノードが多すぎることで,重要な情報が把握しづらい場合も見られた.今後は,得られた情報を使用者に理解しやすい状態で提示することで,さらに役立てることができると考えている.



2017-04-20