次へ: 統計翻訳システム 上へ: honron3 戻る: 表一覧目次

はじめに

機械翻訳は，人手で対訳コーパスや文法のルールを作成するルールベース翻訳がはじめである．しかし，ルールベース翻訳は莫大な時間と労力がかかるという問題点がある．この問題点を改善するために，語に基づく統計翻訳が提案されたが，莫大なデータ量や計算機のパワーが必要であるため，あまり発展しなかった．しかし，句に基づく統計翻訳が提案されたときは，語に基づく統計翻訳の時代と比較して，計算機のパワーが大きく改良されていた．また，句に基づく統計翻訳は，語に基づく統計翻訳と比較して，翻訳精度が高いため，統計翻訳が急速に広がった．

一般的に，統計翻訳では，イタリア語から英語へ翻訳する場合，語彙や語順が似ているため，翻訳精度が高い傾向にある．しかし，日本語から英語へ翻訳する場合，語彙や語順が異なるため，翻訳精度が低い傾向にある．この問題を解決するために，日本語文の単語を並び替えて，英語の語順に近づけてから，統計翻訳を行う研究がされている．

岡崎ら[3]によると，日本語文の主語，目的語，動詞(SOV)を主語，動詞，目的語(SVO)の順に語順変更を行うだけでは翻訳精度は向上しなかった．一方，星野ら[4]によると，述語項構造に基づく語順変更を行ってから，句に基づく統計翻訳を行うことで，翻訳精度が向上した．しかし，これらの研究は翻訳される英語文の語順を推定して，日本語文の語順変更を行っている．そのため，目標とする英語文の最適な語順に並び替えられていない．日本語文を英語文の最適な語順に並び替えてることで，翻訳精度が向上すると考えた．

そこで，本研究では語順変更の手法の限界を調査するため，テスト文に参照文があると仮定し，日本語文を英語の参照文の語順に並び替える．その後，句に基づく統計翻訳を行い，語順変更の効果を調査する．

平成28年3月16日