next up previous contents
Next: 目次 Up: honron Previous: honron   目次

概要

パターン翻訳[1]は,人手により作成した,対訳句辞書と対訳文パター ン辞書を用いて翻訳を行う.翻訳精度の高い出力文が得られるが,対訳句辞書と 対訳文パターン辞書の作成は人手で行うため,開発にコストがかかる. この問題を解決するために江木らは,GIZA++[2]を利用したPattern Based SMT[3]を提案した.対訳句辞書と対訳文パターン辞書を自動 的に作成により,開発コストを削減することができた.しかし,対 訳文パターンに適合しても,人手評価が低い出力文があった.この問題の原因 の一つは,不適切な対訳文パターンの選択であった.そこで本研究では,日英 Pattern Based SMTにおいて,対訳文パターンの日本語原文と入力文とのレーベ ンシュタイン距離[4](以下LsD)を求める.この距離を利用して,対訳 文パターンの日本語原文と入力文が類似した対訳文パターンの選択を行い,翻訳 精度の向上を目指した. 実験の結果,入力文100文中出力文81文を取得.人手 による対比較評価をした結果,提案手法の翻訳精度の向上はあまり見られなかった.



2015-03-21