next up previous
Next: 「形容詞+並列型名詞句」 Up: 実験 Previous: 実験

「形容詞+の型名詞句」


「形容詞+の型名詞句」ではテストデータとして新潮文庫の小説100冊(約60万文) から抜き出した3541件のデータに対して人手で正解を付与したものを用いた.し かし,今回の手法では形容詞毎に頻度統計をとる必要があり,全ての形容詞を対象 とすることはテストデータの量や計算量の面から困難である.そこで比較的多く のデータが抽出できた形容詞「長い」(101件)のみを使用する.また,頻度統計用 のデータとして,同じく新潮文庫の小説100冊からテストデータを除いた「長い+ 名詞」(1619件)を用いた.結果を表1に示す.表中のALL A方式は係り 先を全てA係りとした場合である.比較のため,字面のみの解析と意味属性のみに よる解析を行った.ここで,字面のみによる解析では.頻度による係り先が判定で きない場合を全てA係りとした.



 
 
Table: 「形容詞+の型名詞句」の係り先判定精度
  正解率(正解数/被適用数)
字面による解析 90% (40/44)
意味属性による解析 70% (40/57)
合計 79% (80/101)
字面のみによる解析 77% (78/101)
意味属性のみによる解析 75% (76/101)
ALL A方式 73% (74/101)


また,このときの優先度は7.3であった.優先度tに対する正解率の変化を図 5に示す.図より優先度が7.3〜18.0のとき最も正解率が高かった.



  
Figure 5: 優先度と正解率の関係
\begin{figure}
\begin{center}
\fbox{
\epsfile{file=pref.eps,height=48mm,width=73mm}
} \vspace{-2mm}
\end{center}\end{figure}





Noboru KURUMAI
2001-03-20