next up previous
Next: 学習方法 Up: 意味ベクトルと意味距離の導入 Previous: 意味ベクトルの定義

意味距離の定義

本論文におけるベクトル ${\bf x}=(x_1~x_2~x_3~x_4)$とベクトル ${\bf
y}=(y_1~y_2~y_3~y_4)$の距離計算は次の通りである.


\begin{displaymath}D({\bf x},{\bf y})=\sum_{k=1}^4 w_k d_k(x_k,y_k)
\end{displaymath}

Dはベクトル間距離,dkk番目の要素間の距離,wkk番目の要素 間距離に対する重みを表す.

ここで,本研究では離散的でかつ値の大小に意味を持たない意味属性番号をベク トルの要素として用いている.そこで,それぞれの要素間の距離を,意味距離に よって計算する.

次に,前節で述べた意味ベクトルにおける例外処理に対して,上記の意味距離と は異なる計算法を定義する.

まず,ベクトルの第一要素が「*」の場合,つまりすべての名詞を表す場合はあ らゆる名詞と距離が近く,且つ等しいと考えて,距離は0とする.反対に値が NULLの場合,つまり「の」が主体を持たない場合は,あらゆる主体名詞との距離が遠 いと考え,一般名詞意味属性上での最大距離21より1多い22を距離とする.また, 一方が「*」で一方がNULLの場合の距離は22とする.以上をまとめると図[*]になる.


  
Figure 2: 第一要素における例外的距離の定義
\begin{figure}
\begin{center}
\fbox{
\epsfile{file=distance_noun.eps,height=30mm,width=50mm}
} \end{center}\end{figure}

次にベクトルの第三要素がauxの場合,つまり「の」に助動詞が後置する場合は,助 詞との距離をnとする.この値は助詞間の距離の定義と同じ値である.

最後にベクトルの第四要素がdecの場合,つまり「の」の係り先が用言である場合は, 名詞とは全く異なる性質を持つものとして,第一要素における「*」と同様に距 離は22とする.次に値がNULLの場合は,すべての名詞との距離が遠いと考え, decと同じく距離は22とする.また,一方がNULLで一方がdecの場合の距離は22と する.以上をまとめると図3になる.


  
Figure 3: 第四要素おける例外的距離の定義
\begin{figure}
\begin{center}
\fbox{
\epsfile{file=distance_dec.eps,height=30mm,width=50mm}
} \end{center}\end{figure}



Noboru KURUMAI
2001-03-20