Next: 関連研究
Up: soturon
Previous: 図目次
目次
近年,インターネット上で様々な電子テキストが増加し,これらの電子テキストから有益な情報を取り出す技術が望まれている.
大竹ら[#!ootake!#]は,電子テキストから特定のキーワードに基づく関係情報をネットワークとして抽出する方法を提案し,「地震」というキーワードに基づいて単語ネットワークの構築を行った.
Doenら[#!doen!#]は,大竹らが構築したネットワークに関連のない事物のノードを含むことを確認し,それらのノードを削除を行った.
しかし大竹らとDoenらが構築したネットワークは,ノード同士の関係を示す情報がなく,関係性が分かりづらいという問題がある.
そこで本研究では,新聞記事群データからノード同士の関係を表す文字列を抽出し,抽出した文字列を単語ネットワークのリンクに付与する手法を提案する.
リンクに関係性を示す文字列を付与することで,構築した単語ネットワークから得られる情報がより詳細なものとなる.
本研究の目的は,ノード同士の関係性を分かりやすくすることにより,単語ネットワークの利便性の向上を図ることである.
本研究の主張点を以下に示す.
- 単語ネットワークのノード同士の関係を示す情報がなく,関係性が分かりづらいという問題を解決するために,ノード同士の関係を単語ネットワークのリンクにノード同士の関係性を示す文字列を付与する.
- リンクに文字列を付与することで,関係が分かりづらい単語同士の関係性を確認した.
- 提案手法で得られた出力結果に対して,MRRを用いた評価,1位正解率を用いた評価,5位正解率を用いた評価を行った.付与する文字列に,余分な部分や,関係性をさらに分かりやすくするには不十分な部分があっても正解とする基準で評価した場合,MRRを用いた評価では約7割,1位正解率を用いた評価では約6割,5位正解率を用いた評価では約9割の性能を得た.
- 文字列を抽出する際に,句読点を区切りとする手法と,句点を区切りとする手法の2つの手法で実験を行った.2つの手法での実験結果を評価し,性能を比較した.その結果,2単語間の関係を示すものとして適切な場合を正解とする基準での評価は,句読点を区切りとする手法の方が良い性能となった.しかし,2単語間の関係を示すものとして適切ではあるが,余分な部分があっても正解とする基準で評価した場合,句点を区切りとする手法の方が良い性能となった.また,2単語間の関係を示すものとして適切ではあるが,余分な部分や,関係性をさらに分かりやすくするには不十分な部分があっても正解とする基準で評価した場合,両手法ともほぼ同等の性能という結果となった.
本論文の構成は以下の通りである.
第2章では,本研究の関連研究を述べ,
第3章では,本研究の基本となるネットワーク構築の流れについて述べる.
第4章では,リンクへの文字列付与の手法を提案する.
第5章では,実験条件と実験結果や評価方法と評価結果を述べる.
第6章では,結果の考察と今後の課題を述べる.
第7章では,本論文のまとめを述べる.
2016-03-17