4.1節で新聞データとWikipediaからの抽出結果を比較した. Wikipediaでは頻度の高い単語においても重要でない単語が多く抽出された.一方新聞データでは,社会的に大きな事柄については高頻度で記述されるため, 抽出結果が良かった.
このような結果より,本研究では新聞データを使うのが適していると考える.