見やすくなった部分に関する考察

見やすい部分の個数については,提案手法が従来手法を上回った.

しかし,従来手法でも見やすいと判断した部分は存在した.見やすいと判断した部分には,図4.1と図4.4で示したように,企業名や地名といった固有名詞が多く,これらの情報は新聞記事において共起しやすいと考えられる.

提案手法については,図4.2と図4.3で「遺跡」をテーマキーワードとしてネットワークを示したが,いずれも「縄文」と「弥生」という日本史上の歴史区分の間に,「土器」というものが出現していた.この原因は,Word2vecを利用して単語集合を作成した際,「縄文」「弥生」「土器」が同じ単語集合に所属しているからである. 今回はWord2vecで5000個の単語集合を作成したが,より似た意味の単語を近くに配置し,見やすさを改善するために,単語集合作成の際に,単語集合の数の調整を行う必要があると考える.