next up previous contents
次へ: 本研究の翻訳システムの手順 上へ: 翻訳システム 戻る: 翻訳システム   目次

本研究の翻訳システム

統計翻訳では文法情報として,一般にN-gramモデルを用いる.しかし N-gramモデルは局所的な文法情報をモデル化するので,大局的な文法情報 がない.したがって,文法構造が大きく異なる言語間では特異な文章が生成さ れる可能性がある.

そこで本研究では,まず統計翻訳を行う前にパターン翻訳を行う.この処理 により,日英文パターンが有する大局的な文法情報を用いるのでN-gramモデル の局所的な構文問題が解消出来ると考えている.次に,パターン翻訳の出力文に 対し統計翻訳を行う.この処理により,局所的な修正を行うことで翻訳精度が向 上すると考えている.

また本研究では,日英文パターン辞書を人手で作成するのではなく,プログラム で自動的に作成する.この手法により,日英文パターン辞書の開発時間が短縮出 来る.図4.1に提案手法の翻訳手順を示す.

図 4.1: 提案手法の翻訳手順
\fbox{
\includegraphics{translation_flow_new.eps}
}



平成22年2月11日