next up previous
次へ: 翻訳モデル 上へ: 統計翻訳システム 戻る: 統計翻訳システム

基本概念

日英の統計翻訳は,日本語文$ j$ が与えられたとき,全ての組合せの中から確率 が最大になる英語文$ \hat{e}$ を探索することで翻訳を行う[1].以下に その基本式を示す.

$ \hat{e}=argmax_{e}P(j\vert e)P(e)$

$ P(e\vert j)$ は翻訳モデル,$ P(e)$ は言語モデルと呼ぶ.翻訳モデルは日本語と英 語が対になった対訳コーパスから学習して作成する.また,言語モデルは,出 力文側の言語である英語コーパスから学習して作成する.デコーダは言語モデ ルと翻訳モデルを用いて,尤度の最も高い英文を生成する.



Jin'ichi Murakami 平成22年9月2日