オンライン上でのテキストマイニングの研究

岡田ら[11]とTakamaら[12]はメタキーワードを用いた拡張ベクトル空間モデル(M2VSM)をテキストマイニングに利用した.従来のベクトル空間モデルでは,文書のクラスタリング,つまり,文書群の分類を行う際,用語のクラスタの粒度を調整することが困難であった. そこで,索引語となる名詞に加えて,名詞を修飾する形容詞や副詞といったメタキーワードを抽出し,類似度計算においてこれらを考慮するようにベクトル空間を拡張した. そのようにすることで,クラスタの粒度を調節でき,文書群をより詳細な内容ごとに分類することを可能にした.そのクラスタリングの結果を,オンラインのテキストマイニングツールに利用することで,大量のテキストを処理できるようにした.