next up previous contents
次へ: Model3 上へ: 翻訳モデル 戻る: Model1   目次

Model2

Model1において, $P(f_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$は英語文の長さ\(l\)のみに依存する.しかし,Model2では,\(j\)単語目のアライメント\(a_{j}\),フランス語文の長さ\(m\)にも依存する.この場合,以下のような関係となる.


$\displaystyle a(a_{j}\vert j,m,l) \equiv P(a_{j}\vert a_{1}^{j-1},f_{1}^{j-1},m,e)$     (2.11)

これより,(2.6)式は以下の式のようになる.
$\displaystyle P(f\vert e)$ $\textstyle =$ $\displaystyle \frac{\epsilon}{(l+1^{m})} \sum_{a_{1}=0}^{l}…\sum_{a_{m}=0}^{l}\prod_{j=1}^{m}t(f_{j}\vert e_{a_{j}})a(a_{j}\vert j,m,l)$ (2.12)
  $\textstyle =$ $\displaystyle \frac{\epsilon}{(l+1^{m})}\prod_{j=1}^{m}\sum_{i=0}^{l}t(f_{j}\vert e_{a_{j}})\alpha(l\vert j,m,l)$ (2.13)

Model2における期待値は $c(f\vert e;{\bf f},{\bf e})$ $c(i\vert j,m,l;{\bf f},{\bf e})$の二種類ある.これらは以下の式で求められる.
$\displaystyle c(f\vert e;{\bf f},{\bf e})$ $\textstyle =$ $\displaystyle \frac{t(f\vert e)}{t(f\vert e_{0})+…+t(f\vert e_{l})}\sum_{j=1}^{m}\delta(f\vert f_{j})\sum_{i=1}^{l}\delta(e\vert e_{i})$  
  $\textstyle =$ $\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)\delta(f\vert f_{j})\delta(e...
...{j}\vert e_{0})\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$ (2.14)
$\displaystyle c(i\vert j,m,l;{\bf f},{\bf e})$ $\textstyle =$ $\displaystyle \sum_{a}P(a\vert e,f)\delta(i,a_{j})$  
  $\textstyle =$ $\displaystyle \frac{t(f\vert e)\alpha(i\vert j,m,l)}{t(f_{j}\vert e_{0})\alpha(0\vert j,m,l)+…+t(f_{j}\vert e_{l})\alpha(l\vert j,m,l)}$ (2.15)

なお,Model2は,EMアルゴリズムで計算した場合,複数の極大値を持ち,最適解を求める保証はない.しかし,Model1は,Model2において, $a(a_{j}\vert j,m,l)=(l+1)^{-1}$となる特殊な状態であり,最適解を求めることができる.このため,Model2で最適解を求めるとき,Model1を用いる.



平成28年3月16日