提案手法の概要

赤野らの研究[#!AKANO!#]では以下の問題がある.クラスタリングで重要な単語レベルの情報を文書から抽出する際に,人手でクラスター数を決めて,最適なクラスター数になっていない.重要な列も人手で選択する必要がある.最後にできた表の精度が低い.岡崎らの研究[#!OKAZAKI!#]では最適なクラスター数と列の重要度を計算して,文レベルで重要な情報を表に整理するが,文が長くなると,重要な情報が見づらいのような場合がある.本研究では最適なクラスター数と列の重要度の計算方法を使って,重要な単語レベルの情報を文書から抽出して,表に整理する.