next up previous contents
次へ: ノードの抽出における条件付き確率とTF-IDFの比較についての考察 上へ: 考察 戻る: 考察   目次

実験データの選定についての考察

実験に扱うデータについての考察を行う.

4.1節で新聞データとWikipediaからの抽出結果を比較した. Wikipediaでは頻度の高い単語においても重要でない単語が多く抽出された.一方新聞データでは,社会的に大きな事柄については高頻度で記述されるため, 抽出結果が良かった.

このような結果より,本研究では新聞データを使うのが適していると考える.



平成25年2月21日