次へ: 2)METEOR
上へ: 翻訳の評価方法
戻る: 自動評価
目次
BLEU(BiLingual Evaluation Understudy)は,機械翻訳システムの自動評価において,現在主流となっている評価法である.BLEUは語順(4-gram)が正しい場合に高いスコアを出力し,0から1までの値で評価を行う.BLEUの算出には,以下の式を用いる.
|
|
|
(2.7) |
(2.7)式のNには,
を用いる.
は翻訳文が正解文と比較して短い場合に用いるペナルティ係数である.これは,翻訳文が正解文よりも短い場合に適合率が上がってしまうことを回避するために用いられる.
また,(2.7)式の
は以下の式で計算される.
平成25年2月13日