next up previous contents
Next: 翻訳システム Up: thesis Previous: 表目次   目次

はじめに

翻訳システムの一手法として“パターン翻訳" がある.パターン翻訳は大量の対訳文パターンと単語辞書を用いて,翻訳文を出力する手法である.パターン翻訳は,入力文が適切な対訳文パターンに適合した場合に,翻訳精度の高い翻訳文が得られやすいという特徴がある.しかし,パターン翻訳に用いる単語辞書と対訳文パターンは人手で作成するため,開発コストが高くなる.

一方,翻訳システムとして“単語に基づく統計翻訳" がある.単語に基づく統計翻訳は,学習データとして対訳文を与えるだけで翻訳ができる.このため,翻訳にかかるコストが低い.さらに,対訳文から単語辞書と単語翻訳確率を自動的に得ることが可能である.

江木らは,パターンに基づく統計翻訳を考案した.パターンに基づく統計翻訳は,統計的手法を用いて,対訳句と句レベル文パターンを自動作成して翻訳を行う.しかし,この手法は翻訳精度が低い.原因の一つとして,対応する原言語と目的言語が不自然な対訳句が翻訳時に選択されていることが挙げられる.そして翻訳時の対訳句の選択には対訳フレーズ確率を使用している.

本研究では,翻訳時の対訳句の選択における二つの手法を提案する. 一つ目は,フレーズ確率の総積である. 二つ目は,Dice係数と類似度の積である.

以上の手法により翻訳精度向上を目指す.

本論文の構成を以下に示す.第2章で翻訳システムについて説明する.第3章で提案手法について説明する.そして,第4章では実験環境を,第5章で実験結果を示し,第6章で本研究の考察を述べる.



2018-03-06