次へ: 考察
上へ: 係り先決定実験
戻る: IPS方式
目次
係り受け解析ツールcabochaでの解析を行い,一般に使用されているツールと安
井手法との比較を行った.評価対象は解析実験に使用したオープンデータ375件
から,ランダムに抽出した100件である.結果を表6にまとめる.比較のために使用し
たcabochaは,Windwos版である.
表 6:
cabochaとの比較
判定手法 |
正解率 |
安井手法 |
77%(77/100) |
cabocha |
73%(73/100) |
デフォルト規則 |
74%(74/100) |
結果は,安井手法の正解率が74%で,cabochaの正解率が73%となった.
安井手法が,cabochaの正解率を4%上回っていることから,安井手法は「V+A
のB」型名詞句については,一般に使用されている解析器よりも有効であると
いえる.安井手法とcabochaが出力した係り先を見ると大きな違いがあった.
その違いを表7,表8にまとめる.
表 7:
出力された係り先
判定手法 |
A係り判定 |
B係り判定 |
解析不能 |
計 |
安井手法 |
67 |
33 |
0 |
100 |
cabocha |
97 |
1 |
2 |
100 |
表 8:
出力された係り先で正解となった数
判定手法 |
A係り判定 |
B係り判定 |
計 |
安井手法 |
60 |
17 |
77 |
cabocha |
72 |
1 |
73 |
表7から,cabochaは,ほとんどの解析文をA係りと出力していることが分かる.
つまり,cabochaの正解率はA係りが多いほど向上していくと考えられる.
一方,安井手法は,特に一方への判定が大きく偏ることがない.
そのため,安井手法は,A係り,B係りの割合の影響を受けにくい解析方法で
あると考えられる.
平成19年3月25日