一般的に,統計翻訳では,イタリア語から英語へ翻訳する場合,語彙や語順が似ているため,翻訳精度が高い傾向にある.しかし,日本語から英語へ翻訳する場合,語彙や語順が異なるため,翻訳精度が低い傾向にある.この問題を解決するために,日本語文の単語を並び替えて,英語の語順に近づけてから,統計翻訳を行う研究がされている.
岡崎ら[3]によると,日本語文の主語,目的語,動詞(SOV)を主語,動詞,目的語(SVO)の順に語順変更を行うだけでは翻訳精度は向上しなかった.一方,星野ら[4]によると,述語項構造に基づく語順変更を行ってから,句に基づく統計翻訳を行うことで,翻訳精度が向上した.しかし,これらの研究は翻訳される英語文の語順を推定して,日本語文の語順変更を行っている.そのため,目標とする英語文の最適な語順に並び替えられていない.日本語文を英語文の最適な語順に並び替えてることで,翻訳精度が向上すると考えた.
そこで,本研究では語順変更の手法の限界を調査するため,テスト文に参照文があると仮定し,日本語文を英語の参照文の語順に並び替える.その後,句に基づく統計翻訳を行い,語順変更の効果を調査する.