次へ: 日英パターン翻訳システム 上へ: shuron 戻る: 表一覧目次

はじめに

機械翻訳の歴史は文法規則や変換規則などを用いて翻訳を行うルールベース翻訳から始まる．この手法では，日本語と英語のルールを定義する必要がある．例えば，日本語のルール[ $S \rightarrow NP は VP$ ]がある場合には，英語のルール[ $S \rightarrow NP \ VP$ ]といった，ルールの対が大量に必要となる．したがって，翻訳するためのルールを作成するには，多言語化が困難であり，開発に時間がかかる．そして1960年代半ばに，大量の翻訳対から作成した文パターン辞書を用いて翻訳を行うパターン翻訳 [1]が提案される．ルールと同様に，パターン辞書も人手で作成するので，開発に時間がかかる [2]が，文パターンに適合した場合に翻訳精度の高い翻訳文が得られる． 1990年代前半に「語に基づく統計翻訳」が提案されたが，翻訳精度が低くあまり研究がされなかった．しかし，2000年の初めに「句に基づく統計翻訳[3]」が提案され，「語に基づく統計翻訳」と比べて翻訳精度が高いことから，現在，機械翻訳において統計翻訳が主流となっている．統計翻訳では英語-イタリア語など文法構造が類似する言語対において翻訳精度が高くなり，日本語-英語などの文法構造が異なる言語対においては翻訳精度が低くなる傾向がある[4]．過去に，英語の文法構造を日本語の文法構造に類似させる研究[5]がされており，翻訳精度の向上が報告されている．

そこで本研究では，パターン翻訳の利点と統計翻訳の利点を活かすことを考え，文パターン辞書を対訳文対から自動的に作成する手法を検討する．文パターン辞書の自動作成により，開発にかかるコストの削減が可能となる．また，パターン翻訳を統計翻訳の前処理に用いることで，日本語の文法構造を英語に類似し翻訳精度が向上すると考えられる．

本論文の構成は以下の通りである．第2章で従来の日英パターン翻訳システムについて説明し，第3章で従来の日英統計翻訳システムについて説明し，第4章では本研究で提案する翻訳システムについて説明する．第5章で実験環境を説明し，第6章で翻訳実験について述べ，第7章で実験結果を示し，第8章で本研究の考察を述べる．

平成24年3月23日