next up previous
次へ: 粒度による汎化(S-VSM(g))と値による汎化 (S-VSM(w))の比較 上へ: 実験結果 戻る: 実験結果

単語意味属性を基底とした文書ベクトル(SーVSM)と 単語を基底とした文書ベクトル空間法(W-VSM)の比較

2,710種類の意味属性のすべてを使用する場合について情報検索実験を行い, 従来の単語を基底とした文書ベクトル空間法(W-VSM)と検索精度を比較する.

本論文の方法による検索精度を従来の単語を基底とした文書ベクトル空間法と比 べた結果を図3に示す.図3では,情報検索において類 似度$ \alpha $以上の文書を抽出した場合について,$ \alpha $と再現率$R$, 適合率$P$の関係を示している.なお,類似度0.7以上とする場合は,検索される 文書が1件程度となってしまい,信頼できないので,グラフから削除した.

図 3: 記事の類似度と検索の精度の関係
[width=13cm]figure/gra22.eps
Similarity and Performance of Information Retrieval

また,この結果から得られた類似度$ \sim $と検索精度$F$値の関係を 図4に示す.

図 4: 記事の類似度と検索の精度の関係
[width=13cm]figure/gra1.eps
Similarity and F value

これらの図から,以下のことが分かる.

  1. 単語意味属性を基底とした 文書ベクトルは,単語を基底とした文書ベクトル空間法に比べて,すべての類似度 領域で,再現率が高く,適合率が低い.

  2. 検索精度($F$値の最大値)は,両者は殆ど変わらない.



平成15年4月18日