通常,統計翻訳においては,翻訳精度の向上を目的として,パラメータの最適 化を行う.この節では,パラメータの最適化をおこなったときの,提案方法の 有効性を調査する.パラメータの最適化には,Minimum Error Rate Training(MERT)[8]を用いる.尚,フレーズテーブルの作成には mosesに付属しているtrain-factored-phrase-model.perlを用いる.ま た,reorderingモデルも組み込む.
developmentデータは,単文の実験も重複文の実験も,テストデータ (4.3節)と同一の辞書から抽出したデータを利用する.単文 の翻訳実験には,developmentデータに単文100文を使用してパラメータの最適 化を行う.重複文の翻訳実験にはdevelopmentデータに重複文1,000文を使用し てパラメータの最適化を行う.
テスト文 | 評価法 | ベースライン | 提案手法 |
単文 | BLEU | 0.131 | 0.140 |
METEOR | 0.383 | 0.395 | |
重複文 | BLEU | 0.084 | 0.086 |
METEOR | 0.313 | 0.325 |
表の結果から,パラメー タの最適化を行った翻訳実験においても,BLEUが単文において0.9%,重複文に おいて0.2%上昇し,提案手法の有効性が示された.