next up previous contents
次へ: 謝辞 上へ: soturon 戻る: 未知語の問題   目次

おわりに

本研究では,単文コーパス181,988文,重文複文コーパス121,719文を学習データに 用いて単文・重文複文の翻訳精度の評価を行ない,統計翻訳の基本的な評価と問題 点を検討した.

実験の結果,max-phrase-lengthの値は20が適切であり,言語モデルは5-gramを 用いることが適切であることが確認できた.また,言語モデルは学習データ量に対し て,翻訳精度をほぼ線形に変化させ,翻訳モデルは非線形に変化させることがわかった. 最後に,重文複文の翻訳に,学習データとして単文を用いたとき翻訳精度が 向上した.また,単文の翻訳においても,単文を用いたときに適切な訳文が多 く出力された.このことから,学習データとして単文が有効であることがわかった.

今後は,フレーズテーブルのクリーニングを行ない,その有効性を調査すること を考えている.



平成20年3月25日