評価方法

次へ: 統計翻訳の基本的な評価 上へ: 実験環境 戻る: 重文複文コーパス目次

機械翻訳システムの翻訳精度を自動評価する手法としては，あらかじめ実験者が用意した正解文と，翻訳システムが出力した文とを比較する手法が一般的である．そのような自動評価法には多くの方法がある．本研究では，BLEU[9]， NIST[9]，METEOR[10]を使用する．

BLEUは4-gramが正しい場合に，NISTは単語訳が正しい場合に，そして，METEORは単語属性が正しい場合にそれぞれ高いスコアを出す．BLEUとMETEORの評価は0から1の間で評価され，1が最も良い評価である．NISTの評価は0から無限大で評価され，高いほど良い評価である．

平成20年3月25日