パターン翻訳は, 入力された原言語文に対して, 対訳句と文パターン(原言語文パターンと目的言語文パターンの対の構成)を用いて翻訳文を出力する. パターン翻訳は, 入力文が適切な文パターンに適合した場合, 翻訳精度の高い文を出力する傾向にある. しかし, 対訳句と文パターンを人手作成するために, 開発にコストがかかる.
そこで, 江木らは, パターンに基づく統計翻訳を提案した. パターンに基づく統計翻訳は, 統計的手法を用いて, 対訳句と文パターンを自動作成して翻訳を行う. しかし, 自動作成された対訳句の問題として, 対応する原言語と目的言語が不自然な対訳句が多く含まれていることがあげられる.
ところで, 人手作成された対訳句には, 鳥バンクと英辞郎がある. 通常, 人手作成された対訳句は, 自動作成された対訳句よりも信頼性が高い. しかし, 対訳句を自動作成する翻訳と比較すると, カバー率が低くなる.
本研究では, 人手作成された対訳句として鳥バンクと英辞郎を用いて, パターンに基づく日英統計翻訳を行い, 翻訳精度とカバー率の調査を行った. また, 対訳句を自動作成するパターンに基づく統計翻訳と対比較評価を行った.
対比較評価の結果, 人手作成された対訳句を用いたパターンに基づく統計翻訳と対訳句を自動作成するパターンに基づく統計翻訳の翻訳精度に大きな差がないことがわかった. しかし, カバー率は, 人手作成された対訳句を用いたパターンに基づく統計翻訳が低かった. よって, 対訳句を自動作成して翻訳するパターンに基づく統計翻訳の有効性を示せた.