next up previous
次へ: 単語意味属性を基底とした文書ベクトルの効果 上へ: 意味属性体系を基底とした文書ベクトル空間法 戻る: 単語意味属性を基底とした文書ベクトル空間法 (S-VSM)


日本語単語の意味属性体系

単語の代わりに意味属性を基底とする文書ベクトル空間法では,単語の意味属性 についての分類体系が必要である.本論文では,意味分類体系として,最近, 「日本語語彙大系」[木谷他木谷他1998]で提案された日本語名詞の意味属性体系を使用 する.図1に意味属性体系の一部を示す.

図 1: 一般名詞意味属性体系の一部
[width=13cm]figure/zu1.eps
Portion of General Noun Semantic Attributes System

この意味属性体系は,日本語名詞の意味的な用法を2,710種類の意味属性に分 類したもので,意味属性間の意味的関係(is-a関係,has-a関係)が,12段の 木構造で表現されている.また,単語意味辞書では,日本語名詞30万語のそれ ぞれが,どのような意味属性を持つか(一つ以上)が規定されている.従って, 文書中に使用された名詞の出現頻度が分かれば,3式のベクトルの要 素$S_i$は,$i$番目の意味属性を持つ名詞の出現頻度から2.3 章で述べた方法で容易に求めることができる.



平成15年4月18日