next up previous
次へ: 値による汎化 と 頻度による汎化 上へ: 考察 戻る: 基底数の削減のためのテストデータ

必要最小限の意味属性

粒度による汎化(S-VSM(g)において文書ベクトル数を700に汎化したときに残っ た単語意味属性を調査した.この結果.汎化で残った単語意味属性の多くは,汎 化をする前に$tf \cdot idf$ 値が大きく,かつ頻度も多い単語意味属性であっ た.例として「抽象」,「名詞」,「事」など意味意味属性であった.



平成15年4月18日