次へ: 翻訳モデル 上へ: 日英統計翻訳システム 戻る: 統計翻訳とは目次

日英統計翻訳における基本モデル

日英統計翻訳システムの枠組を図2.1に示す．

図: 日英統計翻訳の枠組
$\fbox{ \includegraphics*[clip,width=12cm]{nitiei.eps} }$

日英統計翻訳は，翻訳元言語の日本語文が与えられた場合，全ての組合せの中から，確率値が最大となる翻訳先言語の英語文êを探索することにより翻訳を行う．以下にその基本モデルを示す．

$\displaystyle \mathring{e}$	$\textstyle =$	$\displaystyle argmax_{e}P(e\vert j)$	(2.1)
	$\textstyle \simeq$	$\displaystyle argmax_{e}P(j\vert e)P(e)$	(2.2)

$P(j\vert e)$ は翻訳モデル，

は言語モデル, $argmax_{e}P(j\vert e)P(e)$ はデコーダーにより求められる確率値が最大となる翻訳候補である． $P(e\vert j)$ を直接求めるには，2言語の確率モデルを正確に推定することが困難であることが挙げられる．そこで，翻訳モデルを用いて翻訳候補を生成した後，言語モデルを用いて，デコーダーより適切な翻訳を得る可能性を高めている．また，パラメータチューニングを行うことで，より適切な翻訳を得る可能性を高めている．

平成26年3月29日