表1に自動評価と人手評価が大きく異なる例文を示す.本節では日英翻 訳を想定する.表中の出力文は,入力文の機械翻訳の結果である.表 中の正解文は,入力文の人手による翻訳である.
入力文 | ホラー映画を見るのは楽しくありません。 |
出力文 | This is interesting to see the horror movie . |
正解文 | This is not interesting to watch the horror movie . |
この例では,人間の評価では,出力文の意味は入力文と逆になるため,低くなる.しか し,自動評価では,出力文と正解文において多くの単語が一致しているため, 高くなる.