next up previous contents
Next: DFの置き換えによるネットワークの変化 Up: 提案手法 Previous: 不要単語リストの作成   目次


アンドテーマキーワードによる情報の追加取得

ネットワークの作成後,使用者が興味をもったノードや興味のある単語をアンドテーマキーワードとする.そして,テーマキーワードとアンドテーマキーワードで検索エンジンを用いてアンド検索を行い,ネットワークを再度作成する.これにより,使用者にとって興味深いネットワークやアンドテーマキーワードに沿った内容のネットワークを作成することができる.この手法をアンドテーマ手法とする.以下にアンドテーマ手法の手順を示す.


手順1
作成したいネットワークの主となる概念を示す単語をテーマキーワードとして設定し,興味のある単語をアンドテーマキーワードとして設定する.
手順2
検索エンジンを用い,テーマキーワードとアンドテーマキーワードでのアンド検索の検索結果を記事群Aとして作成する.
手順3
記事群Aのテーマキーワードが含まれている記事のみを利用するために,記事群Aからテーマキーワードとアンドテーマキーワードを含む記事を抽出し,記事群Bを作成する.2回目以降は,テーマキーワード,新たなキーワード,アンドテーマキーワードの3つをそれぞれ含む記事を抽出する.
手順4
記事群Bに形態素解析を用い,ノード候補となる単語を抽出する.その際にアンドテーマキーワード,1文字,数字のみの単語を除外する.また,4.2節の不要単語リストに含まれる単語も除外する.
手順5
得られたノード候補の中から,TF-IDFの値を用いて,その値が最も大きい5単語を次のノードとする.
手順6
テーマキーワード,次のノードとなった単語,アンドテーマキーワードの3つで検索エンジンを用いてアンド検索を行い,新しい検索結果で記事群Aを再度作成する.その後,次のノードの単語を新たなキーワードとし,手順3より同様の処理を繰り返すことでネットワークを拡大していく.例として,テーマキーワードが「宇宙」,新たなキーワードが「飛行」,アンドテーマキーワードが「ロケット」の場合,「宇宙 飛行 ロケット」で検索を行い, その検索結果を記事群Aとして使用する.



2017-04-20