次へ: METEOR
上へ: 自動評価
戻る: 自動評価
目次
BLEUは,機械翻訳システムの自動評価において,現在主流となっている評価法である.
-gram適合率を用いて,語順の正確さで評価を行う.実験では-gramを用いる.
0から1のスコアで評価し,語順が正解文に近いとき高いスコアを出力する.BLEUの計算式を以下に示す.
BLEUは1〜-gramの適合率の幾何平均にBPをかけた式で表される.
BP(Brevity Penaty)は,短い翻訳文が高いスコアになることを防ぐためのペナルティである.
平成25年2月13日