そこで江木らは,対訳文パターンと対訳句を統計的手法で自動的に作成し翻訳する方法を提案した.これを``パターンに基づく統計翻訳"と呼ぶ.しかし翻訳結果を調査したところ,不適切な対応をとる対訳句が翻訳文に含まれていた.
本研究では不適切な対応をとる対訳句が翻訳文に含まれることを抑制するため,翻訳文の選択において,不適切な対応をとる対訳句を含む翻訳文の出力を抑制する. そこで,人手で作成した対訳句を利用して多変量解析を行う. 具体的には,人手で作成した対訳句と自動抽出した対訳句を比較し,ロジスティック回帰分析を用いて,複数の確率から対訳句に確率を付与する.そして翻訳文の選択において,ロジスティック回帰分析から得た確率を用いてパターンに基づく日英統計翻訳を行う.
翻訳実験の結果,入力文100文から翻訳文78文を得た.さらに従来手法との対比較評価において,提案手法○が7文,提案手法×が3文であり,提案手法の有効性が確認できた.