next up previous contents
次へ: 翻訳モデル 上へ: 統計翻訳システム 戻る: 統計翻訳システム   目次

基本概念

日英の統計翻訳は,日本語文$j$が与えられたとき,全ての組合せの中から確率 が最大になる英語文$\hat{e}$を探索することによって翻訳を行う.以下にその 基本モデルを示す.

$\hat{e}=argmax_{e}P(j\vert e)P(e)$

$P(j\vert e)$は翻訳モデル,$P(e)$は言語モデルと呼ぶ.

日英統計翻訳システムの枠組を図2.1に示す.

図 2.1: 日英統計翻訳システムの枠組
\includegraphics[width=12cm,clip]{Z1ex.eps}

図2.1で示すように,翻訳モデルは日本語と英語の対訳文が集まった,対訳コーパス から学習して作成する.また,言語モデルは,出力文側の言語である英語コーパ スから学習して作成する.言語モデルと翻訳モデルを用いて,$\hat{e}$を探索 する翻訳システムが図中のデコーダである.



平成21年3月17日