Next: ネットワークの拡大
Up: 先行手法
Previous: ノード候補の抽出
目次
ノード候補の選定
TF-IDFとは,抽出した記事内におけるノード候補となっている単語の重要度を表す.
TF-IDFを用いて,抽出されたノード候補の中から,実際にノードに用いる単語を選定する.
本研究では,TF-IDF値の上位5単語をキーワードと関係性の強い単語とする.
TF-IDFは以下の式3.1で算出される.
TFはキーワードを含む記事における単語の出現回数,DFは全記事のうちの単語を含む記事数,Nは全記事数を示す.
この式から,どの記事にも現れるような重要度の低い単語については低い重みを,他の記事にあまり現れないような単語には高い重みを与えている.
2017-04-20