Next: 目次
Up: honron
Previous: honron
目次
パターン翻訳[1]は,人手により作成した,対訳句辞書と対訳文パター
ン辞書を用いて翻訳を行う.翻訳精度の高い出力文が得られるが,対訳句辞書と
対訳文パターン辞書の作成は人手で行うため,開発にコストがかかる.
この問題を解決するために江木らは,GIZA++[2]を利用したPattern
Based SMT[3]を提案した.対訳句辞書と対訳文パターン辞書を自動
的に作成により,開発コストを削減することができた.しかし,対
訳文パターンに適合しても,人手評価が低い出力文があった.この問題の原因
の一つは,不適切な対訳文パターンの選択であった.そこで本研究では,日英
Pattern Based SMTにおいて,対訳文パターンの日本語原文と入力文とのレーベ
ンシュタイン距離[4](以下LsD)を求める.この距離を利用して,対訳
文パターンの日本語原文と入力文が類似した対訳文パターンの選択を行い,翻訳
精度の向上を目指した.
実験の結果,入力文100文中出力文81文を取得.人手
による対比較評価をした結果,提案手法の翻訳精度の向上はあまり見られなかった.
2015-03-21