そこで, 江木らは, パターンに基づく統計翻訳を提案した[2]. パターンに基づく統計翻訳は, 統計的手法を用いて, 対訳句と文パターンを自動作成して翻訳を行う. しかし, 自動作成された対訳句の問題として, 対応する原言語と目的言語が不自然な対訳句が多く含まれていることがあげられる.
ところで, 人手作成された対訳句には, 鳥バンク[3]と英辞郎[4]がある. 通常, 人手作成された対訳句は, 自動作成された対訳句よりも信頼性が高い. しかし, 対訳句を自動作成する翻訳と比較すると, カバー率が低くなる.
本研究では, 人手作成された対訳句として鳥バンクと英辞郎を用いて, パターンに基づく日英統計翻訳を行い, 翻訳精度とカバー率の調査を行う. また, 対訳句を自動作成するパターンに基づく統計翻訳と対比較評価を行う. 0 対比較評価の結果, 鳥バンク○が13文(自動作成○10文), 英辞郎○が3文(自動作成○5文)であり, 自動作成と比べて翻訳精度に大きな差はなかった. しかし, カバー率は, 鳥バンクを用いたパターンに基づく統計翻訳は42%, 英辞郎を用いたパターンに基づく統計翻訳は13%, 自動作成は82%であり, 人手作成された対訳句を用いたパターンに基づく統計翻訳が自動作成より低かった.
対比較評価の結果, 鳥バンクを用いたパターンに基づく統計翻訳と英辞郎を用いたパターンに基づく統計翻訳ともに, 対訳句を自動作成するパターンに基づく統計翻訳の翻訳精度に大きな差がないことがわかった. また, カバー率においては, 鳥バンクを用いたパターンに基づく統計翻訳と英辞郎を用いたパターンに基づく統計翻訳ともに対訳句を自動作成するパターンに基づく統計翻訳より低かった. よって, 対訳句を自動作成して翻訳するパターンに基づく統計翻訳の有効性を示せた.