next up previous contents
次へ: モデル3 上へ: 翻訳モデル 戻る: モデル1   目次

モデル2

モデル1では,全ての単語の対応に対して,単語対応の確率を一定としているが,これは現実的ではない.そこでモデル2では,$ j$ 番目の仏単語$ f_j$ と対応する英単語の位置$ a_j$ は英語文の長さ$ l$ に加えて,$ j$ と,フランス語文の長さ$ m$ に依存するとし,以下のように仮定する.


$\displaystyle a(a_j\vert j, m, l) \equiv P(a_j\vert a^{j-1}_1, f^{j-1}_1, m, l)$     (11)

この仮定より,モデル1における(6)式は,以下の式に変換できる.


$\displaystyle P(F\vert E)$ $\displaystyle =$ $\displaystyle \epsilon \sum^l_{a_1=0} \cdots \sum^l_{a_m=0} \prod^m_{j=1}
t(f_j\vert e_{a_j})a(a_j\vert j, m, l)$ (12)
  $\displaystyle =$ $\displaystyle \epsilon \prod^m_{j=1} \sum^l_{i=0} t(f_j\vert e_{a_j})a(a_j\vert j, m, l)$ (13)

モデル2では,期待値は $ c(f\vert e;F,e)$ $ c(i\vert j,m,l;F,E)$ の2つが存在する.以 下の式から求められる.


$\displaystyle c(f\vert e;F,E)$ $\displaystyle =$ $\displaystyle \frac{t(f\vert e)}{t(f\vert e_0) + \cdots + t(f\vert e_l)}
\sum^m_{j=1} \delta(f,f_j) \sum^l_{i=1} \delta(e,e_i)$ (14)
  $\displaystyle =$ $\displaystyle \sum^m_{j=1} \sum^l_{i=0} \frac{t(f\vert e) a(i\vert j,m,l)
\del...
...e_i)} {t(f\vert e_0) a(0\vert j,m,l) + \cdots
+ t(f\vert e_l) a(l\vert j,m,l)}$ (15)
$\displaystyle c(i\vert j,m,l;F,E)$ $\displaystyle =$ $\displaystyle \sum_a P(a\vert E,F) \delta(i,a_j)$ (16)
  $\displaystyle =$ $\displaystyle \frac{t(f_j\vert e_i) a(i\vert j,m,l)}{t(f_j\vert e_0) a(0\vert j,m,l) +
\cdots + t(f_j\vert e_l)a(l\vert j,m,l)}$ (17)

$ c(f\vert e;F,E)$ は対訳文中の英単語$ e$ と仏単語$ f$ が対応付けされる回数の期待値を表し, $ c(i\vert j,m,l;F,E)$ は英単語の位置$ i$ が仏単語の位置$ j$ に対応付けされる回数の期待値を表している.

モデル2は,複数の極大値を持つため,最適解が得られない可能性がある.モデル1では $ a(i\vert j,m,l)={l+1}^{-1}$ となるモデル 2の特殊な場合であると考えられる.モデル1は最適解に必ず収束するため,モデル1を用いることで最適解を得ることができる.



平成23年4月12日