Next: 提案手法
Up: 先行手法
Previous: ネットワークの拡大
目次
新聞を用いたネットワークの作成
先行手法では,新聞記事群のデータ(以降は新聞データとする)を元に,単語ネットワークを作成する.入力及びDFの計算にはそれぞれ,毎日新聞(2012年1年分)を用いる.先行手法の手順を以下に示す.
- 手順1
- 作成するネットワークの主となる概念を,テーマキーワードとして設定する.
- 手順2
- 新聞データのテーマキーワードが含まれている記事のみを利用するために,新聞データからテーマキーワードを含む記事を抽出し,記事群Aを作成する.2回目以降は,テーマキーワードと新たなキーワードをそれぞれ含む記事を抽出する.【3.2節の処理に相当】
- 手順3
- 抽出した記事群Aに形態素解析を用い,ノード候補になる単語を抽出する.その際に1文字,数字のみの単語を除外する.また,4.2節の不要単語リストに含まれる単語も除外する.【3.3,3.4節の処理に相当】
- 手順4
- 得られたノード候補の中から,TF-IDFの値を用いて,その値が最も大きい5単語を次のノードとする.【3.5節の処理に相当】
- 手順5
- 次のノードとなった単語を新たなキーワードとして手順2に戻り,同様の処理を繰り返すことでネットワークを拡大していく.【3.6節の処理に相当】
2017-04-20