そこで江木らは,対訳文パターンと対訳句を統計的手法で自動的に作成し翻訳する方法を提案した(以下,従来手法)[3].これを``パターンに基づく統計翻訳"と呼ぶ.しかし翻訳結果を調査したところ,不適切な対応をとる対訳句が翻訳文に含まれていた.
不適切な対応をとる対訳句が翻訳文に含まれることを抑制するため,2つの方法が考えられる. 一つは対訳句の作成において,不適切な対応をとる対訳句の作成を抑制する方法である.もう一つは翻訳文の選択において,不適切な対応をとる対訳句を含む翻訳文の出力を抑制する方法である. 本研究では後者の方法をとる.そこで,人手で作成した対訳句を利用して多変量解析を行う. 具体的には,人手で作成した対訳句と自動抽出した対訳句を比較し,ロジスティック回帰分析を用いて,複数の確率から対訳句に確率を付与する.そして翻訳文の選択において,ロジスティック回帰分析から得た確率を用いてパターンに基づく日英統計翻訳を行い,翻訳精度の調査を行う.
翻訳実験の結果,入力文100文から翻訳文78文を得た.さらに従来手法との対比較評価において,提案手法○が7文,提案手法×が3文であり,提案手法の有効性が確認できた.
本論文の構成は以下の通りである.第2章で種々の翻訳システムについて説明し,第3章で提案手法について説明する.そして第4章で実験データと実験結果を示す.第5章で提案手法の評価を示し,第6章で考察を述べる.