next up previous contents
次へ: 統計翻訳システム 上へ: honron3 戻る: 表一覧   目次

はじめに

機械翻訳は,人手で対訳コーパスや文法のルールを作成するルールベース翻訳がはじめである.しかし,ルールベース翻訳は莫大な時間と労力がかかるという問題点がある.この問題点を改善するために,語に基づく統計翻訳が提案されたが,莫大なデータ量や計算機のパワーが必要であるため,あまり発展しなかった.しかし,句に基づく統計翻訳が提案されたときは,語に基づく統計翻訳の時代と比較して,計算機のパワーが大きく改良されていた.また,句に基づく統計翻訳は,語に基づく統計翻訳と比較して,翻訳精度が高いため,統計翻訳が急速に広がった.

一般的に,統計翻訳では,イタリア語から英語へ翻訳する場合,語彙や語順が似ているため,翻訳精度が高い傾向にある.しかし,日本語から英語へ翻訳する場合,語彙や語順が異なるため,翻訳精度が低い傾向にある.この問題を解決するために,日本語文の単語を並び替えて,英語の語順に近づけてから,統計翻訳を行う研究がされている.

岡崎ら[3]によると,日本語文の主語,目的語,動詞(SOV)を主語,動詞,目的語(SVO)の順に語順変更を行うだけでは翻訳精度は向上しなかった.一方,星野ら[4]によると,述語項構造に基づく語順変更を行ってから,句に基づく統計翻訳を行うことで,翻訳精度が向上した.しかし,これらの研究は翻訳される英語文の語順を推定して,日本語文の語順変更を行っている.そのため,目標とする英語文の最適な語順に並び替えられていない.日本語文を英語文の最適な語順に並び替えてることで,翻訳精度が向上すると考えた.

そこで,本研究では語順変更の手法の限界を調査するため,テスト文に参照文があると仮定し,日本語文を英語の参照文の語順に並び替える.その後,句に基づく統計翻訳を行い,語順変更の効果を調査する.



平成28年3月16日