この問題を解決するために,様々な研究がなされている. Xiaoguangらは,中英翻訳において,モノリンガルコーパスを,ルールベース翻訳を用いて翻訳し,モノリンガルコーパスとその翻訳文を対訳コーパスに加えることで翻訳精度の向上を試みた[2]. また,Holgerは,仏英翻訳において,大量のモノリンガルコーパスを,統計翻訳を用いて翻訳することで, 対訳コーパスを増加させた[3].しかし,いずれも翻訳精度の向上はほとんど認められなかった.これは,モノリンガルコーパスの翻訳文全てを用いたためであると考えられる.
そこで本研究では,モノリンガルコーパスの翻訳文から精度の高い文を抽出し,対訳コーパスに加える 手法を提案する.モノリンガルコーパスと,精度の高い翻訳文の対を学習データに加えることで,翻訳 精度の向上を目指す.また,対訳辞書データを補うため,``英辞郎"[4]を用いる.翻訳対の量が多い英辞郎の データを対訳コーパスに付与することで,統計翻訳の精度を向上させる.
本論文の構成を以下に示す.第2章で従来の日英統計翻訳システムについて説明し,第3章で提案手法のシステムについて説明する.そして,第4章では実験環境を,第5章で実験結果を示し,第6章で本研究の考察を述べ,第7章で今後の課題を述べる.