Next: 単語意味属性を用いたベクトル空間法
Up: ベクトル空間法
Previous: ベクトル空間法
従来のベクトル空間法は、文書の意味を文書内の単語を基底とする特性ベクトルで表現する。
特性ベクトルの各要素には、文書中での単語Wiの重みを絶対値が1になるように正規化した値wiを与える(式1)。
そして、特性ベクトルの間の距離が近い文書を類似文書として検索する。
一般的には、各文書Di,Djの特性ベクトルの内積をとり、cosinの値を文書間の類似度
sim(Vi,Vj)(式2)とする。
|
(1) |
|
(2) |
2000-05-30