next up previous contents
Next: 提案手法 Up: 先行手法 Previous: ネットワークの拡大   目次


新聞を用いたネットワークの作成

先行手法では,新聞記事群のデータ(以降は新聞データとする)を元に,単語ネットワークを作成する.入力及びDFの計算にはそれぞれ,毎日新聞(2012年1年分)を用いる.先行手法の手順を以下に示す.

手順1
作成するネットワークの主となる概念を,テーマキーワードとして設定する.
手順2
新聞データのテーマキーワードが含まれている記事のみを利用するために,新聞データからテーマキーワードを含む記事を抽出し,記事群Aを作成する.2回目以降は,テーマキーワードと新たなキーワードをそれぞれ含む記事を抽出する.【3.2節の処理に相当】
手順3
抽出した記事群Aに形態素解析を用い,ノード候補になる単語を抽出する.その際に1文字,数字のみの単語を除外する.また,4.2節の不要単語リストに含まれる単語も除外する.【3.33.4節の処理に相当】
手順4
得られたノード候補の中から,TF-IDFの値を用いて,その値が最も大きい5単語を次のノードとする.【3.5節の処理に相当】
手順5
次のノードとなった単語を新たなキーワードとして手順2に戻り,同様の処理を繰り返すことでネットワークを拡大していく.【3.6節の処理に相当】



2017-04-20