next up previous contents
次へ: 考察 上へ: 係り先決定実験 戻る: IPS方式   目次

cabochaとの比較実験

係り受け解析ツールcabochaでの解析を行い,一般に使用されているツールと安 井手法との比較を行った.評価対象は解析実験に使用したオープンデータ375件 から,ランダムに抽出した100件である.結果を表6にまとめる.比較のために使用し たcabochaは,Windwos版である.

表 6: cabochaとの比較
判定手法 正解率
安井手法 77%(77/100)
cabocha 73%(73/100)
デフォルト規則 74%(74/100)

結果は,安井手法の正解率が74%で,cabochaの正解率が73%となった. 安井手法が,cabochaの正解率を4%上回っていることから,安井手法は「V+A のB」型名詞句については,一般に使用されている解析器よりも有効であると いえる.安井手法とcabochaが出力した係り先を見ると大きな違いがあった. その違いを表7,表8にまとめる.


表 7: 出力された係り先
判定手法 A係り判定 B係り判定 解析不能
安井手法 67 33 0 100
cabocha 97 1 2 100


表 8: 出力された係り先で正解となった数
判定手法 A係り判定 B係り判定
安井手法 60 17 77
cabocha 72 1 73

表7から,cabochaは,ほとんどの解析文をA係りと出力していることが分かる. つまり,cabochaの正解率はA係りが多いほど向上していくと考えられる. 一方,安井手法は,特に一方への判定が大きく偏ることがない. そのため,安井手法は,A係り,B係りの割合の影響を受けにくい解析方法で あると考えられる.



平成19年3月25日