next up previous contents
次へ: 統計翻訳の基本的な評価 上へ: 実験環境 戻る: 重文複文コーパス   目次

評価方法

機械翻訳システムの翻訳精度を自動評価する手法としては,あらかじめ実験者が 用意した正解文と,翻訳システムが出力した文とを比較する手法が一般的である. そのような自動評価法には多くの方法がある.本研究では,BLEU[9], NIST[9],METEOR[10]を使用する.

BLEUは4-gramが正しい場合に,NISTは単語訳が正しい場合に,そして,METEORは 単語属性が正しい場合にそれぞれ高いスコアを出す.BLEUとMETEORの評価 は0から1の間で評価され,1が最も良い評価である.NISTの評価は0から無限大で 評価され,高いほど良い評価である.



平成20年3月25日