次へ: NIST
上へ: 自動評価
戻る: 自動評価
目次
BLEUは機械翻訳分野において,一般的に使用される自動評価の手法である.BLEUは語順(4-gram)が正しい場合に高いスコアを出す.
BLEUは以下の式で計算される.
ここで,は出力文と正解文のN-gramの一致率を表している.
BLEUはこの一致率を1-gramから4-gramまで計算し,その幾何平均をとる.
また,出力文が正解文より短い場合,``
出力文iのN-gramの数''が小さくなり,不当にスコアが高くなる可能性がある.
そこで,正解文より短い文に対するペナルティとして,を用いる.の条件式を以下に示す.
ここで,は出力文の単語数,は正解文の単語数を表している.
出力文が正解文より長い場合はとなり,出力文が正解文より短い場合は,その短さに応じてBPが小さくなり,BLEU値も小さくなる.
BLEUは0から1の値をスコアとして出力し,スコアの値が高いほど翻訳精度が高いことを示す.
s102025
平成27年3月9日