next up previous contents
次へ: エッジの重みの計算結果 上へ: TF-IDFを用いた社会構造モデルの構築 戻る: TF-IDFを用いた社会構造モデルの構築   目次

ノードの抽出結果

キーワードを「地震」として,TF-IDFを用いる提案手法により,社会構造モデルを構築する. キーワード「地震」から得られた単語を単語aとして同様の手順を用いて単語aと関連性の高い単語を抽出する. これらの手順を複数繰り返し「地震」と直接つながらない単語をノードに持つモデルを構成する. 単語aに対してモデルのノードとして抽出する単語は,TF-IDFのスコア上位5単語とする.

単語aから5つの単語へのエッジのスコアは,その5つの単語のTF-IDFのスコアから計算される確率で求める. 5つの単語のうちの一つである単語nへのエッジのスコアは式4.1で表される.

$\displaystyle \displaystyle score = \frac{単語nのtfidf}{5単語のtfidfの和}$ (4.1)

この手法により社会構造モデルを自動構築した. 「地震」を第一単語群,「地震」から抽出された単語を第二単語群,第二単語群から抽出された新しい単語を第三単語群,同様に第四単語群とする. その抽出結果を表4.6,表4.7, 表4.8に示す.


表: 第二単語群
第二単語群 津波, 原発, 避難, 被災, 福島        


表: 第三単語群
第三単語群 宮城,事故,原子力,東電,電話,        
  大震災, 復興,東日本        


表: 第四単語群
第四単語群 岩手,安全,号機,東京電力,相談,        
  携帯,ボランティア,東京,首相,支援        



平成25年2月21日