一般に,言語表現をベクトルで表す場合,ベクトルの各基底には,ある単語(あ
るいは意味属性)の頻度情報を用いる場合が多い.しかし,この方法ではどの単語がどの
ような文法的要素として使われたかが分からず,文を正確にベクトルとして表現
しているとは言いがたい.一方,本論文で提案する手法では,ベクトルの基底に
文法的情報を介した単語意味属性を用いる.この場合はベクトルによって表現さ
れた部分を元の状態に再現することが可能である.ここで問題になるのは,
ベクトル間の距離の定義である.本論文で定義する意味ベクトルの各基底はいず
れも非線形であるために距離の定義が簡単ではない.そこで基底が名詞あるいは
用言の場合は,is-a関係,has-a関係で結ばれた木構造上で表現する.これによ
り同じツリー上の2つの要素間に距離を定義することができ,結果としてベクト
ル間の距離を求めることができる.この手法は限られた統語環境において,言語
表現をベクトル表現に変換するのに有効であり,要素の組み合わせによってさま
ざまに意味が変化する言語現象を解析するのに適した手法であると考えられる.