next up previous contents
次へ: 翻訳システム 上へ: honron 戻る: 表一覧   目次

はじめに

パターン翻訳[1]は,機械翻訳における一種の翻訳方式である.入力文が適切な文パターンと照合した場合,翻訳精度の高い文を出力するが,適合しない場合は翻訳ができない.また,翻訳に用いる単語辞書と対訳文パターンを人手で作成するために,開発にコストがかかる.

そこで江木らは,単語辞書と対訳文パターンを統計的手法を用いて自動的に作成する``パターンに基づく統計翻訳[2]''(以下, 従来手法)を提案した.この従来手法は,対訳句の抽出において,対訳文と単語レベル文パターンを照合して得る方法が用いられる.しかし,単語レベル文パターンから全ての可能な対訳句を出力するために,不適切な対応をとる対訳句が多く出力されていた.そこで本研究では,対訳句の変数全体の確率値を利用して最適な対訳句を出力する,PATTERN法とSENTENCE法の2手法を用いる.これにより,対訳句の出力数を抑制し不適切な対応をとる対訳句の数を減らすことで,対訳句の精度向上を目指す.また,出力した対訳句を用いて日英統計翻訳を行い,翻訳精度の調査を行う.

実験の結果,対訳句の出力数が大幅に削減できており,対訳句の精度の向上が確認できた.また,翻訳文100文より提案手法の対比較評価を行い,PATTERN法○が14文,SENTENCE法○が19文となり,わずかにSENTENCE法の翻訳精度が高い結果となった.



s122025 平成28年3月21日