next up previous contents
次へ: 目次 上へ: soturon 戻る: soturon   目次

概要

日英統計翻訳では,旅行会話タスクと特許翻訳タスクのようにドメインの違いに よる翻訳精度の報告がされている.特に旅行会話タスクでは,高い精度が得られ ている.しかし,文の構造別の翻訳精度の報告は行なわれてこなかった. 本研究では,辞書の例文をドメインとして,単文コーパスと重文複文コーパスに 分類し,それぞれの翻訳精度の評価を行なう.また,言語モデルや翻訳モデルに 関する基本的な評価も行なう.

実験の結果,max-phrase-lengthの値は20が適切であり,言語モデルは5-gramを 用いることが適切であることが確認できた.また,言語モデルは学習データ量に対し て,翻訳精度をほぼ線形に変化させ,翻訳モデルは非線形に変化させることがわかった. 最後に,重文複文の翻訳に,学習データとして単文を用いたとき翻訳精度が 向上した.また,単文の翻訳においても,単文を用いたときに適切な訳文が多 く出力された.このことから,学習データとして単文が有効であることがわかった.

今後は,フレーズテーブルのクリーニングを行ない,その有効性を調査すること を考えている.



平成20年3月25日