next up previous contents
次へ: 翻訳モデル 上へ: 統計翻訳システム 戻る: 統計翻訳システム   目次

基本概念

日英統計翻訳は,日本語文jが与えられたとき,全ての組合せの中から確率が最大となる英語文1#1 を探索することにより翻訳を行う.
2#2 3#3 4#4 (2.1)
  3#3 5#5 (2.2)
  6#6 7#7 (2.3)

8#8 は翻訳モデル,P(e)は言語モデルである.2.1式はベイズの法則2.1より,2.2式に展開される.2.2式の分母はeによっては変わらないため,大小の比較は結局2.3式に近似できる.

これは,2言語間のモデル 10#10 を正確に推定することが困難なためである.そのため,一般に,高い信頼性を持つことが知られている言語モデルと翻訳モデルを併用し,翻訳精度を高めている.日英統計翻訳の枠組を図2.1に示す.

図: 日英統計翻訳の枠組
11#11

2.1で示すように,翻訳モデルは日本語学習文と英語学習文が集まった,対訳学習文から学習して作成する.また,言語モデルは,出力文の言語である英語学習文から学習して作成する.翻訳モデルと言語モデルを用いて,1#1 を探索する翻訳システムが図中のデコーダである.



平成24年3月23日