BLEUは出力された翻訳文と正解翻訳文を4-gramで,単語列が正しいか評価する.NIST scoreは,出力された翻訳文と正解翻訳文を5-gramで,単語訳が正しいか評価する.METEORは意味などの単語属性が正しいか評価する.RIBESは文全体の大局的な並びが正しいか評価する.BLEUとMETEORとRIBESにおける評価値の範囲は0から1であり,1が最大となる.NISTにおける評価値の範囲は0から無限大であり,評価値が高いほど良い評価となる.