next up previous
次へ: 必要最小限の意味属性の決定 上へ: 汎化の方法 戻る: 粒度による汎化 S-VSM(g)

$tf \cdot idf$ 値による汎化 S-VSM(w)

検索対象となるデータベースの文書全体での $tf \cdot idf$ 値の小さい意味属 性は,検索に寄与する程度が小さいと考えられるため, $tf \cdot idf$ 値の小 さい意味属性を汎化の対象とする.汎化によって削除された意味属性の $tf \cdot idf$ 値は,上位直属の意味属性の $tf \cdot idf$ 値に加算する.直属 の意味属性が削除されているときは,さらに上位の意味属性の $tf \cdot idf$ 値に加算する.図2に, $tf \cdot idf$ 値が5以下の意味属性 を汎化する場合の例を示す.

図 2: 汎化の方法
[width=13cm]figure/zu2.eps
Generalization Methods



平成15年4月18日