next up previous contents
次へ: おわりに 上へ: 対訳フレーズデータのみを用いた翻訳実験 戻る: 対訳フレーズデータのみを用いた翻訳実験   目次

自動評価結果

対訳フレーズデータ実験に対して日英統計翻訳,英日統計翻訳を行った翻訳結果に対して自動評価を行った. 日英統計翻訳の結果を表7.10に,英日統計翻訳の結果を表7.11に示す.


表: 自動評価結果(日英翻訳)
  単文 重文複文
      BLEU NIST METEOR BLEU NIST METEOR
ベースライン 0.1091 3.982 0.4597 0.0916 3.627 0.2645
提案手法(鳥バンク) 0.1068 3.839 0.4566 0.0894 3.382 0.2526
対訳フレーズデータ実験(鳥バンク) 0.1015 3.777 0.4453 0.0761 3.251 0.2298
提案手法(英辞郎) 0.1114 3.989 0.4625 0.0944 3.626 0.2667
対訳フレーズデータ実験(英辞郎) 0.1059 3.943 0.4558 0.0851 3.518 0.2557


表: 自動評価結果(英日翻訳)
  単文 重文複文
      BLEU NIST BLEU NIST
ベースライン 0.1519 4.114 0.1132 3.487
提案手法(鳥バンク) 0.1522 4.088 0.1102 3.354
対訳フレーズデータ実験(鳥バンク) 0.1441 3.941 0.0944 3.072
提案手法(英辞郎) 0.1527 4.109 0.1157 3.511
対訳フレーズデータ実験(英辞郎) 0.1469 4.034 0.1059 3.372

結果から,対訳フレーズデータ実験の自動評価結果はベースラインより劣っているという結果になった. この原因は,対訳フレーズデータのみでは学習データ不足であるため,評価値がベースラインより下がったためであると考えられる.


next up previous contents
次へ: おわりに 上へ: 対訳フレーズデータのみを用いた翻訳実験 戻る: 対訳フレーズデータのみを用いた翻訳実験   目次
平成23年3月23日