Next: 評価例:変換テーブル(AがB)
Up: 実験結果
Previous: 作成した変換テーブルの数の調査
Contents
作成した変換テーブルの精度の調査
表5.1の変換テーブルの数から,ランダムに100個を抜き出し,その精度を人手評価した.なお,「AがBならばCはD」の「AがB」の部分と「CはD」の部分を分割し,それぞれの対応を評価した.評価基準を表5.2に示す.
Table 5.2:
変換テーブルの評価基準
○ |
日本語側と英語側が正しく対応している |
△ |
日英のどちらかに余分な単語を含む |
1#1 |
日本語側と英語側が間違った対応をしている |
評価結果を表5.3に示す.表5.3より変換テーブルの精度は高いことがわかる.
Table 5.3:
作成した変換テーブルの精度
|
○ |
△ |
1#1 |
AがB |
95 |
2 |
3 |
CはD |
75 |
16 |
9 |
表5.3より変換テーブルの精度は高いことがわかる.精度の高い変換テーブルを利用して翻訳を行うことで,翻訳精度も高いことが予測される.
「AがB」の部分は単語の対応であり,「CはD」の部分は句の対応であるため,「AがB」の部分と「CはD」の部分の評価には差が生じていると考えられる.また,「AがB」の部分と「CはD」の部分で作成方法は異なる.「AがB」の部分はIBM model1の単語翻訳確率から作成する.一方,「CはD」の部分は単純なパターンマッチングによって作成する.この作成方法の違いも評価の差に影響していると考えられる.
Subsections
Hiroto Yasuba
2019-05-08