next up previous contents
Next: おわりに Up: 今後の課題 Previous: 名詞連続   目次

類似度

類似度の高い単語以外を削除することによって重要情報の一部が削除されるという問題が生じた.この問題が生じた原因は,類似度計算における入力単語に「城」を固定して使用したためであると考えられる.このことから,以上の問題を解決する方法として,以下のような新たな方法が考えられる.

以上のように,各クラスタの概念を示す単語を選定し,その単語の類似単語以外の単語を削除することで,各クラスタ内の関係のない単語を削除できるのではないかと考える.この方法を利用することで,クラスタ内で関係のない単語の数が減少するので,そういうクラスタの単語群を利用すると,より適切な単語からなる表を作成できるのではないかと考える.



akano hokuto 2018-03-06