次へ:
NIST
上へ:
自動評価
戻る:
自動評価
目次
BLEU
BLEUは, 機械翻訳システムの自動評価において, 現在主流となっている評価法である.
-gram適合率を用いて, 語順の正確さで評価を行う.実験では
-gramを用いる. 0から1のスコアで評価し, 語順が正解文に近いとき高いスコアを出力する. BP(Brevity Penaty)は, 短い翻訳文が高いスコアになることを防ぐためのペナルティである. BLEUの計算式を以下に示す.
(3.1)
(3.2)
(3.3)
平成26年3月7日