次へ: 統計翻訳の基本的な評価
上へ: 実験環境
戻る: 重文複文コーパス
目次
機械翻訳システムの翻訳精度を自動評価する手法としては,あらかじめ実験者が
用意した正解文と,翻訳システムが出力した文とを比較する手法が一般的である.
そのような自動評価法には多くの方法がある.本研究では,BLEU[9],
NIST[9],METEOR[10]を使用する.
BLEUは4-gramが正しい場合に,NISTは単語訳が正しい場合に,そして,METEORは
単語属性が正しい場合にそれぞれ高いスコアを出す.BLEUとMETEORの評価
は0から1の間で評価され,1が最も良い評価である.NISTの評価は0から無限大で
評価され,高いほど良い評価である.
平成20年3月25日