Next: 従来の研究
Up: honron1
Previous: 表目次
目次
パターン翻訳[1]は,1960年代に提案された翻訳方法である.人手に
より作成した,対訳句辞書と対訳文パターン辞書を用いて翻訳を行う.この翻訳
方式は入力文が適切な対訳文パターンに適合した場合,翻訳精度の高い出力文
が得られる.しかし,対訳句辞書と対訳文パターン辞書の作成は人手で行うため,
開発にコストがかかる.そして,入力文が対訳文パターンに適合しない場合は,
翻訳ができない.
また,1990年代に単語に基づく統計翻訳が提案された.原言語文の単語を目的
言語文の単語に翻訳する手法である.しかし,翻訳精度が低い.
しかし,2000年代始めに句に基づく統計翻訳が提案された.句に基
づく統計翻訳は,単語に基づく統計翻訳よりも翻訳精度が高く,学習データとし
て,対訳文を与えるだけで翻訳が可能である.そのため翻訳にかかるコストが低
い.
一方,江木らはパターン翻訳の問題を解決するため,GIZA++[2]を利用したPattern
Based SMT[3]を提案した.この手法は対訳フレーズ辞書と対訳文パターン辞書
を対訳文から自動的に作成し,翻訳を行う.対訳文から自動的に作成するので,
パターン翻訳と比較して,開発コストを低くすることができる.しかし対訳文パ
ターンに適合しても,翻訳精度の低い出力文がある.この問題の原因
の一つは,句に基づく対訳文パターンの確率値に,パターン内の単語におけるGIZA++の値を利用していることにある.
そこで本研究では,そこで本研究では,句に基づく対訳文パターンの確率値の計算に,パターン内の変数部の確率を利用して,翻訳精度の向上を試みる.実験として,100文の対比較実験を行い,人手による対比較評価をした.実験の結果,提案手法と従来手法は同等の翻訳精度であった.
本論文の構成は以下の通りである.第章で従来の研究について説明し,第章で提案する手法について説明する.第章で実験データ,実験結果と評価を示す.第章で本研究の考察を述べる.
s122036
2016-03-17