next up previous contents
次へ: 日英統計翻訳システム 上へ: honron03_19 戻る: 表一覧   目次

はじめに

機械翻訳は,人手で対訳コーパスや文法のルールを作成するルールベース翻訳がはじめである.しかし,ルールベース翻訳は莫大な時間と労力がかかる欠点がある.この欠点を改善するために,語に基づく統計翻訳が提案されたが,莫大なデータ量や計算機のパワーが必要であるため,あまり発展されなかった.しかし,句に基づく統計翻訳が提案されたときは,語に基づく統計翻訳の時代と比較して,計算機のパワーが大きく改良された.また,句に基づく統計翻訳は,語に基づく統計翻訳と比較して,翻訳精度が高いため,統計翻訳が急速に広がった.

一般的に,統計翻訳では,イタリア語から英語へ翻訳する場合,語彙や文法構造が似ているため翻訳精度が高い傾向がある.しかし,日本語から英語へ翻訳する場合,語彙や文法構造が異なるため,翻訳精度が低い傾向がある.

その問題を解決するために,翻訳する言語の文法構造を目的言語の文法構造に似せて,統計翻訳を行う研究が行われている[1].目的言語の文法構造に似せる方法としては,翻訳する言語に構文解析を使用することで,翻訳する言語の文法構造を把握する.その後,目的言語の文法構造と同じになるように,翻訳する言語の単語列を移動することで文法構造を変更する.構文解析を用いた文法構造を変換した研究は,以下が存在する.ドイツ語-英語統計翻訳においては,構文解析を用いてドイツ語の文法構造を把握し,英語の文法構造に並び替えた.その結果,翻訳精度が向上する傾向となった[2].また,英語-日本語統計翻訳においては,構文解析木を用いて英語の文法構造を日本語の文法構造のように並び替えた.その結果,翻訳精度が向上する傾向となった[3]. しかし,構文解析を用いず,動詞を移動して翻訳する言語の文法構造を変換した結果,翻訳精度が向上する傾向があるという報告がなかった.そこで,本研究では,日本語の動詞を移動することで,英語の文法構造に近づける方法を提案する.そして,単純な文法構造である単文を用いて,日本語の動詞を移動した後,統計翻訳を行い,翻訳精度を調査する.



平成21年3月19日