next up previous contents
Next: 従来の研究 Up: honron1 Previous: 表目次   目次

はじめに

パターン翻訳[1]は,1960年代に提案された翻訳方法である.人手に より作成した,対訳句辞書と対訳文パターン辞書を用いて翻訳を行う.この翻訳 方式は入力文が適切な対訳文パターンに適合した場合,翻訳精度の高い出力文 が得られる.しかし,対訳句辞書と対訳文パターン辞書の作成は人手で行うため, 開発にコストがかかる.そして,入力文が対訳文パターンに適合しない場合は, 翻訳ができない.
 また,1990年代に単語に基づく統計翻訳が提案された.原言語文の単語を目的 言語文の単語に翻訳する手法である.しかし,翻訳精度が低い. しかし,2000年代始めに句に基づく統計翻訳が提案された.句に基 づく統計翻訳は,単語に基づく統計翻訳よりも翻訳精度が高く,学習データとし て,対訳文を与えるだけで翻訳が可能である.そのため翻訳にかかるコストが低 い.
 一方,江木らはパターン翻訳の問題を解決するため,GIZA++[2]を利用したPattern Based SMT[3]を提案した.この手法は対訳フレーズ辞書と対訳文パターン辞書 を対訳文から自動的に作成し,翻訳を行う.対訳文から自動的に作成するので, パターン翻訳と比較して,開発コストを低くすることができる.しかし対訳文パ ターンに適合しても,翻訳精度の低い出力文がある.この問題の原因 の一つは,句に基づく対訳文パターンの確率値に,パターン内の単語におけるGIZA++の値を利用していることにある.
 そこで本研究では,そこで本研究では,句に基づく対訳文パターンの確率値の計算に,パターン内の変数部の確率を利用して,翻訳精度の向上を試みる.実験として,100文の対比較実験を行い,人手による対比較評価をした.実験の結果,提案手法と従来手法は同等の翻訳精度であった.
 本論文の構成は以下の通りである.第[*]章で従来の研究について説明し,第[*]章で提案する手法について説明する.第[*]章で実験データ,実験結果と評価を示す.第[*]章で本研究の考察を述べる.



s122036 2016-03-17