![]() |
(3.1) | ||
| (3.2) |
ここで,
は出力文と正解文のN-gramの一致率を表している.
BLEUはこの一致率を1-gramから4-gramまで計算し,その幾何平均をとる.
また,出力文が正解文より短い場合,``
出力文iのN-gramの数''が小さくなり,不当にスコアが高くなる可能性がある.
そこで,正解文より短い文に対するペナルティとして,
を用いる.
の条件式を以下に示す.
| (3.3) |
は正解文の単語数を表している.
出力文が正解文より長い場合は
となり,出力文が正解文より短い場合は,その短さに応じてBPが小さくなり,BLEU値も小さくなる.
BLEUは0から1の値をスコアとして出力し,スコアの値が高いほど翻訳精度が高いことを示す.