model2

model1において,アライメントの確率は英語文の長さにのみ依存する. そこでmodel2では,英語文の長さに加え,単語目のアライメント, 日本語文の長さに依存するとし,以下の式で表す.
    (19)

よって,model1の式(6)は以下のように置き換えられる.
(20)
  (21)

model2において,対訳文中の英単語と日単語が対応付けされる回数の期待値である と,日単語の位置と英単語の位置が対応付けられる回数の期待値 が存在する.以下に,期待値 を求める式を示す.

(22)
(23)

model2においても,最適解を推定するためにEMアルゴリズムを用いる.しかし,計算によって複数の極大値が算出され,最適解が 得られない場合が存在する.model2の特殊な場合に, が挙げられるが,これはmodel1として考えることができる.また,最適解が保証されているmodel1で求められた値を初期値として用いることで,最適解を求めることができる.



s142006 2018-03-06