2#2 | 3#3 | 4#4 | (2.1) |
3#3 | 5#5 | (2.2) | |
6#6 | 7#7 | (2.3) |
8#8 は翻訳モデル,P(e)は言語モデルである.2.1式はベイズの法則2.1より,2.2式に展開される.2.2式の分母はeによっては変わらないため,大小の比較は結局2.3式に近似できる.
これは,2言語間のモデル 10#10 を正確に推定することが困難なためである.そのため,一般に,高い信頼性を持つことが知られている言語モデルと翻訳モデルを併用し,翻訳精度を高めている.日英統計翻訳の枠組を図2.1に示す.
図2.1で示すように,翻訳モデルは日本語学習文と英語学習文が集まった,対訳学習文から学習して作成する.また,言語モデルは,出力文の言語である英語学習文から学習して作成する.翻訳モデルと言語モデルを用いて,1#1 を探索する翻訳システムが図中のデコーダである.