・モデル2

モデル1では,全ての単語の対応に対して,英語文の長さ17#17にのみ依存し,単語対応の確率を一定としている. そこで,モデル2では,43#43番目の仏単語20#20と対応する英単語の位置 44#44は英語文の長さ17#17に加えて,43#43と,フランス語文の長さ10#10に依 存し,以下のような関係とする.
45#45     (9)

この関係からモデル1における(2.4)式は,以下の式に変換できる.

28#28 26#26 46#46 (10)
  26#26 47#47 (11)

モデル2では,期待値は 48#48 49#49の2つが存在する.以下の式から求められる.

50#50 26#26 51#51 (12)
  26#26 52#52 (13)
53#53 26#26 54#54 (14)
  26#26 55#55 (15)


56#56は対訳文中の英単語8#8と仏単語7#7が対応付けされる回数の 期待値, 49#49は英単語の位置57#57が仏単語の位置43#43に対応付 けされる回数の期待値を表している.

モデル2では,EMアルゴリズムで計算すると複数の極大値が算出され,最適解が 得られない可能性がある.モデル1では 58#58となるモデル 2の特殊な場合であると考えられる.したがって,モデル1を用いることで最適解 を得ることができる.