Model2

次へ: Model3 上へ: 翻訳モデル 戻る: Model1 目次

Model2

Model1において， $P(f_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$ は英語文の長さlのみに依存する．しかし，Model2では，j単語目のアライメント $a_{j}$ ，フランス語文の長さmにも依存する．この場合，以下のような関係となる．

$\displaystyle a(a_{j}\vert j,m,l) \equiv P(a_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$

(3.11)

これより，(2.6)式は以下の式のようになる.

$\displaystyle P(f\vert e)$	$\textstyle =$	$\displaystyle \frac{\epsilon}{(l+1^{m})} \sum_{a_{1}=0}^{l}…\sum_{a_{m}=0}^{l}\prod_{j=1}^{m}t(f_{j}\vert e_{a_{j}})a(a_{j}\vert j,m,l)$	(3.12)
	$\textstyle =$	$\displaystyle \frac{\epsilon}{(l+1^{m})}\prod_{j=1}^{m}\sum_{i=0}^{l}t(f_{j}\vert e_{a_{j}})\alpha(l\vert j,m,l)$	(3.13)

Model2における期待値は $c(f\vert e;{\bf f}，{\bf e})$ と $c(i\vert j,m,l;{\bf f},{\bf e})$ の二種類ある．これらは以下の式で求められる．

$\displaystyle c(f\vert e;{\bf f},{\bf e})$	$\textstyle =$	$\displaystyle \frac{t(f\vert e)}{t(f\vert e_{0}+…+t(f\vert e_{l})}\sum_{j=1}^{m}\delta(f\vert f_{j})\sum_{i=1}^{l}\delta(e\vert e_{i})$
	$\textstyle =$	$\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)\delta(f\vert f_{j})\delta(e... ...{j}\vert e_{0})\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$	(3.14)
$\displaystyle c(i\vert j,m,l;{\bf f},{\bf e})$	$\textstyle =$	$\displaystyle \sum_{a}P(a\vert e,f)\delta(i,a_{j})$
	$\textstyle =$	$\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)}{t(f_{j}\vert e_{0}\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$	(3.15)

なお，Model2は，EMアルゴリズムで計算した場合，複数の極大値を持ち，最適解を求める保証はない．しかし，Model1は，Model2において， $a(a_{j}\vert j,m,l)=(l+1)^{-1}$ となる特殊な状態であり，最適解を求めることができる．このため，Model2で最適解を求めるとき,Model1を用いる．

平成21年3月19日