次へ: 目次
上へ: honron
戻る: honron
目次
概要
本論文では機械翻訳の一種であるパターン翻訳の研究を行う.パターン翻訳は,入力された原言語文に対し,単語辞書と文パターン(原言語文パターンと目的語文パターンの対で構成)を用いて翻訳文を出力する方法である.パターン翻訳の長所として,入力文が適切な文パターンに適合した場合,高品質な翻訳文を得やすい傾向にある.しかし,パターン翻訳には多くの問題点がある.本研究では中でもコストと翻訳精度とカバー率の問題を取り上げる.まず,パターン翻訳は非常にコストがかかる.この理由は単語辞書と文パターンを人手で作成するためである.本研究では単語辞書と文パターンをプログラムで自動作成することでコストの削減を試みた.また,パターン翻訳は翻訳精度が高いとカバー率が低く,カバー率が高いと翻訳精度が低くなる傾向にある.この理由として,入力文に適合した文パターンが保持する字面が関係していると考えた.つまり,文パターンの字面が多ければ翻訳精度が高く(カバー率が低く),少なければカバー率が高く(翻訳精度が低く)なる.加えて,カバー率には,入力文が文パターンに適合しなければ翻訳ができない問題がある.
翻訳精度の問題に対しては,入力文と文パターンの字面を比較する.そして字面が多く一致する文パターンを優先して選択する.カバー率の問題に対しては,大量の文パターンと単語辞書を作成する.
上記のコストと翻訳精度とカバー率の問題を考慮し,パターン翻訳を行った.その結果,英語入力文100文から24文の日本語翻訳文を得た.提案手法で得た日本語翻訳文を評価するために,統計翻訳の世界で主流となっているMosesをベースラインとして翻訳精度の調査を行った.評価方法には自動評価法と人手による対比較評価を用いる.
実験の結果,全ての自動評価において提案手法がベースラインよりも優れていることがわかった.また対比較評価においても,提案手法○が6文に対して提案手法×が3文と提案手法の有効性が確認できた.
平成26年3月13日