・モデル2

モデル1では,全ての単語の対応に対して,英語文の長さ19#19にのみ依存し,単語対応の確率を一定としている. そこで,モデル2では,45#45番目の仏単語22#22と対応する英単語の位置 46#46は英語文の長さ19#19に加えて,45#45と,フランス語文の長さ12#12に依 存し,以下のような関係とする.
47#47     (2.9)

この関係からモデル1における(2.4)式は,以下の式に変換できる.

30#30 28#28 48#48 (2.10)
  28#28 49#49 (2.11)

モデル2では,期待値は 50#50 51#51の2つが存在する.以下の式から求められる.

52#52 28#28 53#53 (2.12)
  28#28 54#54 (2.13)
55#55 28#28 56#56 (2.14)
  28#28 57#57 (2.15)


58#58は対訳文中の英単語10#10と仏単語9#9が対応付けされる回数の 期待値, 51#51は英単語の位置59#59が仏単語の位置45#45に対応付 けされる回数の期待値を表している.

モデル2では,EMアルゴリズムで計算すると複数の極大値が算出され,最適解が 得られない可能性がある.モデル1では 60#60となるモデル 2の特殊な場合であると考えられる.したがって,モデル1を用いることで最適解 を得ることができる.