next up previous contents
次へ: Model3 上へ: 翻訳モデル 戻る: Model1   目次

Model2

Model1において, $P(f_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$は英語文の長さlのみに依存する.しかし,Model2では,j単語目のアライメント$a_{j}$,フランス語文の長さmにも依存する.この場合,以下のような関係となる.


$\displaystyle a(a_{j}\vert j,m,l) \equiv P(a_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$     (3.11)

これより,(2.6)式は以下の式のようになる.
$\displaystyle P(f\vert e)$ $\textstyle =$ $\displaystyle \frac{\epsilon}{(l+1^{m})} \sum_{a_{1}=0}^{l}…\sum_{a_{m}=0}^{l}\prod_{j=1}^{m}t(f_{j}\vert e_{a_{j}})a(a_{j}\vert j,m,l)$ (3.12)
  $\textstyle =$ $\displaystyle \frac{\epsilon}{(l+1^{m})}\prod_{j=1}^{m}\sum_{i=0}^{l}t(f_{j}\vert e_{a_{j}})\alpha(l\vert j,m,l)$ (3.13)

Model2における期待値は $c(f\vert e;{\bf f},{\bf e})$ $c(i\vert j,m,l;{\bf f},{\bf e})$の二種類ある.これらは以下の式で求められる.
$\displaystyle c(f\vert e;{\bf f},{\bf e})$ $\textstyle =$ $\displaystyle \frac{t(f\vert e)}{t(f\vert e_{0}+…+t(f\vert e_{l})}\sum_{j=1}^{m}\delta(f\vert f_{j})\sum_{i=1}^{l}\delta(e\vert e_{i})$  
  $\textstyle =$ $\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)\delta(f\vert f_{j})\delta(e...
...{j}\vert e_{0})\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$ (3.14)
$\displaystyle c(i\vert j,m,l;{\bf f},{\bf e})$ $\textstyle =$ $\displaystyle \sum_{a}P(a\vert e,f)\delta(i,a_{j})$  
  $\textstyle =$ $\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)}{t(f_{j}\vert e_{0}\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$ (3.15)

なお,Model2は,EMアルゴリズムで計算した場合,複数の極大値を持ち,最適解を求める保証はない.しかし,Model1は,Model2において, $a(a_{j}\vert j,m,l)=(l+1)^{-1}$となる特殊な状態であり,最適解を求めることができる.このため,Model2で最適解を求めるとき,Model1を用いる.



平成21年3月19日