next up previous contents
次へ: 目次 上へ: B07T2046B_soturon 戻る: B07T2046B_soturon   目次

概要

近年,機械翻訳において,統計翻訳が注目されている. 統計翻訳では,対訳コーパスから自動的に翻訳規則を獲得し,翻訳を行う. そのため,統計翻訳における翻訳品質は,対訳コーパスの量に大きく依存する. しかし,対訳コーパスの作成には,モノリンガルコーパスに比べて膨大なコストがかかる.

そこで本研究では,対訳コーパスと比較して作成が容易であるモノリンガルコーパスを用いる手法を提案する. はじめに,統計翻訳を用いて大量のモノリンガルコーパスを翻訳する.そして,翻訳文から精度の高い文を抽出し,対訳 コーパスに加えることで,翻訳精度の向上を目指した.実験の結果,既存の対訳コーパスを用いた統計翻訳と比較して,BLEU,NIST,METEORの値において,わずかに向上が認められた. 向上がわずかであった原因として,モノリンガルコーパスを翻訳する際の翻訳精度の低さが考えられる. また,翻訳文からの抽出において,精度の高い文の抽出が不十分であることが考えられる.

よって今後は,より翻訳精度の高い文の抽出方法を検討する.また,より大量のモノリンガルコーパス を用いた実験を行うことを考えている.



平成23年3月3日