翻訳精度の評価方法として,自動評価では実験において得られた10,000文の出力文に対して,4つの自動評価指標(BLEU,METEOR,RIBES,WER1)に基づいて評価を行う.人手対比較評価では出力文10,000文より無作為に抽出した100文に対して,正確性(adequacy:入力文の意味をどれだけ正確に翻訳文より読み取れるか) に基づいて人手対比較評価を行う.