本研究では,概念ネットワーク構築の際に,Word2vecを用いて,出現する単語を同種の単語が出やすくなるようにし,似た意味を持つ単語を近くに配置することで見やすいネットワークを構築したが,いくつかの問題が残っている.本章では,残っている問題を今後の課題として以下にまとめる.
- ネットワークを構築した際に,単語のつながりしか表示されないため,単語間の関係性が分からない.単語に限らず2文節など短い文の形式でも表示できないかを検討する.
- 本研究のTF-IDF合計値法は,有効な手法であるが,テーマキーワードによっては,人名や日付の情報を多く表示させるという問題があった.図5.4で示したように,出現単語がテーマキーワードとどのような関係性があるのかが分からないネットワークが構築される例もあった.この影響を低減する方策を検討したい.
- 1年分の新聞記事を用いてネットワークを構築する際,これまでは本研究のように1年分の情報を一度にネットワークに表示させているが,例えば月ごとといったさらに細かい区分でネットワークを構築し,1つのテーマキーワードから時期ごとの特徴を読み取ることができないかを検討したい.
- 5.1.2節でも述べたように見やすさをさらに向上させるために,Word2vecで単語集合を作成する際に,最適な単語集合の数を検証する.