次へ: エッジの重みの計算結果
上へ: TF-IDFを用いた社会構造モデルの構築
戻る: TF-IDFを用いた社会構造モデルの構築
目次
キーワードを「地震」として,TF-IDFを用いる提案手法により,社会構造モデルを構築する.
キーワード「地震」から得られた単語を単語aとして同様の手順を用いて単語aと関連性の高い単語を抽出する.
これらの手順を複数繰り返し「地震」と直接つながらない単語をノードに持つモデルを構成する.
単語aに対してモデルのノードとして抽出する単語は,TF-IDFのスコア上位5単語とする.
単語aから5つの単語へのエッジのスコアは,その5つの単語のTF-IDFのスコアから計算される確率で求める.
5つの単語のうちの一つである単語nへのエッジのスコアは式4.1で表される.
|
(4.1) |
この手法により社会構造モデルを自動構築した.
「地震」を第一単語群,「地震」から抽出された単語を第二単語群,第二単語群から抽出された新しい単語を第三単語群,同様に第四単語群とする.
その抽出結果を表4.6,表4.7, 表4.8に示す.
表:
第二単語群
第二単語群 |
津波, 原発, 避難, 被災, 福島 |
|
|
|
|
表:
第三単語群
第三単語群 |
宮城,事故,原子力,東電,電話, |
|
|
|
|
|
大震災, 復興,東日本 |
|
|
|
|
表:
第四単語群
第四単語群 |
岩手,安全,号機,東京電力,相談, |
|
|
|
|
|
携帯,ボランティア,東京,首相,支援 |
|
|
|
|
平成25年2月21日