現在,文法構造が大きく異なる言語間での機械翻訳においてハイブリッド翻訳や階層型統計翻訳が注目されている.
ハイブリッド翻訳は,ルールベース翻訳と句に基づく統計翻訳を組み合わせて翻訳を行う. 福田らは,日英翻訳において,句に基づく統計翻訳とハイブリッド翻訳を比較した. その結果,ハイブリッド翻訳が自動評価・人手評価ともに高いスコアを出力した[1].
階層型統計翻訳は,文脈自由文法をモデルとして,統計的に翻訳を行う. 久保田らは,日英翻訳において,句に基づく統計翻訳と階層型統計翻訳を比較した. その結果,階層型統計翻訳が自動評価・人手評価ともに高いスコアを出力した[2].
そこで本研究では,ハイブリッド翻訳に用いられる句に基づく統計翻訳の代わりに階層型統計翻訳を用いて日英翻訳を行った. 日英翻訳において,句に基づく統計翻訳よりも翻訳精度の高い階層型統計翻訳を用いることで,翻訳精度の向上を試みた. 結果として,従来のハイブリッド翻訳と比較して,自動評価・人手評価ともに差がなかった. よって,提案手法は従来手法と差がなく,有効ではなかった. 原因を調査したところ,前処理のルールベース翻訳において,多くの文が文法的に正しく翻訳されていた. ハイブリッド翻訳は前処理に大きく依存するため,後処理の統計翻訳の手法を変えても差が生じなかったのだと考えている.
また,ルールベース翻訳とハイブリッド翻訳を比較したところ,ルールベース翻訳が人手評価において,優れた翻訳を出力していた. 今後は,ハイブリッド翻訳の精度向上のために,より正確な句の対応付けが可能な統計翻訳の方法を考えていく.