next up previous contents
次へ: 取り出したデータと動詞に対する結合価パターンを比較 上へ: 解析方法 戻る: 動詞に対する結合価パターンを抽出   目次

標本文の名詞の意味属性を抽出

結合価パターンと標本文を比較するため、標本文に出てくる動詞の格要素の意味属性と、名詞の意味属性を形態素解 析及び日本語語彙体系で調べ、その中で例文に適合する意味属性を抽出し、データ ベースに登録、作成する。表2はその一部である。

(a)例文を形態素解析にかける。([]内が意味属性)
例4:事故で死亡したドライバーの遺品
  事故(1100,[事件,身体障害])/で(7410)
  死亡し(2233,死亡する)/た(7217)
  ドライバー(1100,[運転手,工具])/の(7410)
  遺品(1100,[持ち物])
例5:市内を流れる川の底
  市内(1100,[内部,行政区画])/を(7430)
  流れる(2217)
  川(1100,[川])/の(7410)
  底(1100,[底])

(b)動詞の格要素、名詞A、名詞Bにおいて例文に適合する意味属性を選択する。
 各名詞には複数の意味属性が存在する場合がある。本研究の係り受け解析では、意味属性を使用するので、例文に適さない意味属性が存在する場合、間違った結果を出してしまう恐れがある。そのため、例文に適する意味属性だけを抽出しておく。例えば、例4の「ドライバー」の意味属性だと、(運転手),(工具)の2つがあるが、この文では(運転手)のほうが適切なので、(工具)は削除する。

(c)表2のようにテーブルに登録する。括弧内は意味属性番号である。ここで、テーブルに登録するのは、標本データをプログラムで自動的に解析するためである。

表 2: 格要素と名詞の意味属性
\begin{table}\end{table}



\includegraphics[height=4cm,width=15cm]{table2.eps}



平成14年2月28日