Next: 従来の研究 Up: honron1 Previous: 表目次目次

はじめに

パターン翻訳[1]は，1960年代に提案された翻訳方法である．人手により作成した，対訳句辞書と対訳文パターン辞書を用いて翻訳を行う．この翻訳方式は入力文が適切な対訳文パターンに適合した場合，翻訳精度の高い出力文が得られる．しかし，対訳句辞書と対訳文パターン辞書の作成は人手で行うため，開発にコストがかかる．そして，入力文が対訳文パターンに適合しない場合は，翻訳ができない．
　また，1990年代に単語に基づく統計翻訳が提案された．原言語文の単語を目的言語文の単語に翻訳する手法である．しかし，翻訳精度が低い．しかし，2000年代始めに句に基づく統計翻訳が提案された．句に基づく統計翻訳は，単語に基づく統計翻訳よりも翻訳精度が高く，学習データとして，対訳文を与えるだけで翻訳が可能である．そのため翻訳にかかるコストが低い．
　一方，江木らはパターン翻訳の問題を解決するため，GIZA++[2]を利用したPattern Based SMT[3]を提案した．この手法は対訳フレーズ辞書と対訳文パターン辞書を対訳文から自動的に作成し，翻訳を行う．対訳文から自動的に作成するので，パターン翻訳と比較して，開発コストを低くすることができる．しかし対訳文パターンに適合しても，翻訳精度の低い出力文がある．この問題の原因の一つは，句に基づく対訳文パターンの確率値に，パターン内の単語におけるGIZA++の値を利用していることにある．
　そこで本研究では，そこで本研究では，句に基づく対訳文パターンの確率値の計算に，パターン内の変数部の確率を利用して，翻訳精度の向上を試みる．実験として，100文の対比較実験を行い，人手による対比較評価をした．実験の結果，提案手法と従来手法は同等の翻訳精度であった．
　本論文の構成は以下の通りである．第

章で従来の研究について説明し，第

章で提案する手法について説明する．第

章で実験データ，実験結果と評価を示す．第

章で本研究の考察を述べる．

s122036 2016-03-17