「形容詞+の型名詞句」ではテストデータとして新潮文庫の小説100冊(約60万文) から抜き出した3541件のデータに対して人手で正解を付与したものを用いた.し かし,今回の手法では形容詞毎に頻度統計をとる必要があり,全ての形容詞を対象 とすることはテストデータの量や計算量の面から困難である.そこで比較的多く のデータが抽出できた形容詞「長い」(101件)のみを使用する.また,頻度統計用 のデータとして,同じく新潮文庫の小説100冊からテストデータを除いた「長い+ 名詞」(1619件)を用いた.結果を表1に示す.表中のALL A方式は係り 先を全てA係りとした場合である.比較のため,字面のみの解析と意味属性のみに よる解析を行った.ここで,字面のみによる解析では.頻度による係り先が判定で きない場合を全てA係りとした.
また,このときの優先度は7.3であった.優先度tに対する正解率の変化を図 5に示す.図より優先度が7.3〜18.0のとき最も正解率が高かった.