next up previous contents
次へ: Model3 上へ: IBM翻訳モデル 戻る: Model1   目次

Model2

Model1では全ての単語の対応付けの確率が一定であるとしており,現実的ではない.そこで,Model2ではj番目の位置である仏単語38#38 と対応する英単語の位置39#39 は,jと英文の長さl,仏文の長さmに依存するとし,2.11式のようにする.


40#40     (2.11)

この仮定を使い,2.11式は2.12式のようになる.また,Model1と同じく重要な特徴として,和と積を入れ換えることができるため,計算効率を向上させることができる.


26#26 3#3 41#41 (2.12)
  3#3 42#42 (2.13)

Model1と同じく,ラグランジェの未定係数を使い, 29#29 , 43#43 の制約のもとで2.13式を最大化する問題を解くことで,2.14式,2.15式の2つの式が得られる.


44#44 3#3 45#45 (2.14)
46#46 3#3 47#47 (2.15)

48#48 は対訳ペア中の英単語eと仏単語fが対応付けられる回数の期待値を表し, 49#49 は英単語の位置iが仏単語の位置jに対応付けられる回数の期待値を表す.

Model2は次の繰り返し計算によって推定される.

  1. 36#36 に適当な初期値を設定する.
  2. 対訳ペアの集合 35#35 において, 48#48 , 49#49 を求める.
  3. 2からそれぞれの総和を求め,正規化することで 36#36 を再推定する.
  4. 2と3を 36#36 が収束するまで繰り返す.

Model2は複数の極大値を持ち,必ずしも最適解を得られるとは限らない.しかし,Model1は 50#50 となるModel2の特別な場合であると考えることができる.しかし,Model1は最適解が保証されているため,初期値としてModel1によって求められたパラメータを使い,Model2の精度を高めることができる.



平成24年3月23日