next up previous contents
次へ: 目次 上へ: soturon 戻る: soturon   目次

概要

現在,機械翻訳において統計翻訳が注目され,研究が盛んに行われている.統計 翻訳では一般にN-gramモデルを用いる.N-gramモデルは局所的な文 法情報であるため,特異な翻訳文が生成される場合がある.

そこで本研究では,まず日英文パターン辞書を用いて日英パターン翻訳を行い, 文法構造を英語に近づける.このとき,従来の文パターン辞書は人手で作成するが,本 研究では自動作成する.この日英文パターンが持つ大局的な文法情報を用い ることでN-gramモデルにおける局所的な構文問題が解消でき,翻訳精度の 向上が可能であると考えた.そして出力文に対し,統計翻訳でさらに英英翻 訳を行う.この処理により,局所的な修正を行うことで翻訳精度が向上すると考 えた.この提案する翻訳システムと従来の統計翻訳システムの比較を行い,その有 効性を調査した.

実験の結果,文パターン辞書の変数が少ない場合には文パターンに文法情報が多く 残るため翻訳精度の高い文が得られ,提案手法の有効性が示された.この場合で の自動評価結果はBLEU値で0.5%,METEOR値では0.08%,NIST値で0.116の改善が 見られた.しかし変数の多い場合には文法情報が損なわれ,翻訳精度が低下する ことがわかった.この場合での自動評価結果はBLEU値で0.4%,NIST値で0.095の 低下が見られた.



平成22年2月11日