表4.4の例文で,人手評価と自動評価にどのように差が生じるか解説する.
入力文 | ホラー映画を見るのは楽しくありません。 |
出力文 | It is fun to see the horror movie . |
参照文 | It is not fun to watch the horror movie . |
表4.4において,人手評価は,入力文と出力文を比較する.出力文の意味は,``ホラー映画を見るのは楽しいです。"であり,入力文の``ホラー映画を見るのは楽しくありません。"と意味が逆転しているので,評価は低い.
一方,表4.4において,自動評価は,出力文と参照文を比較する.その時,出力文と参照文の,アンダーラインが引かれている``It is",``fun to",``the horror movie ."を比較し,文の大部分が一致しているので,評価は高い.
よって,人手評価と自動評価に差が生じる.