next up previous
次へ: 結論 上へ: 考察 戻る: 必要最小限の意味属性

$tf \cdot idf$値による汎化 と 頻度による汎化

2節において,必要最小限の意味属性の決定するために,粒度に よる汎化 (S-VSM(g))と $tf \cdot idf$ 値による汎化(S-VSM(w)) を示した.本 論文でしめした両方法は,どちらも$tf \cdot idf$ 値を利用しているが,単語 の出現頻度を利用する方法も考えられる.そこで4節の実験の前 に,予備実験として,出現頻度を利用する場合と$tf \cdot idf$ 値を利用する 場合で$F$値がどちらが高くなるか調査した.この結果,$tf \cdot idf$ 値を利 用する場合のほうが良い値を示した.そのため,以後の実験においては$tf \cdot idf$ 値を利用した.

なお,頻度が大きいが $tf \cdot idf$値が小さくなる単語意味属性は,,「自 尊,卑下」,「敬称(女)」,「自信,自棄」,「生産行程」,「自信」などであっ た.また,比較的頻度が小さいが $tf \cdot idf$値が大きくなる単語意味属性 は,「乗り物」,「親、祖父母,先祖」,「親」,「報償」,「庭園」,「休 養」,「余暇」などであった.



平成15年4月18日