next up previous contents
次へ: モデル3 上へ: IBM翻訳モデル 戻る: モデル1   目次

モデル2

モデル1では,全ての単語の対応に対して,英語文の長さlにのみ依存し,単語対応の確率を一定としている. そこで,モデル2では,j番目の仏英語18#18 と対応する英単語の位置40#40 は英語文の長さlに加えて,jと フランス語文の長さmに依存し,以下のような関係とする.
41#41     (2.9)

この関係からモデル1における2.4式は,以下の式に変換できる.


42#42     (2.10)
43#43     (2.11)

モデル2では,期待値は 44#44 と 45#45 の2つが存在する.以下の式から求められる.


46#46 24#24 47#47 (2.12)
28#28 24#24 48#48 (2.13)
49#49 24#24 50#50 (2.14)
28#28 24#24 51#51 (2.15)

52#52 は対訳文中の英単語e と仏単語f が対応付けされる回数の期待値を表し, 45#45 は英単語の位置i が仏単語の位置j に対応付けされる回数の期待値を表している. モデル2 は,複数の極大値を持つため,最適解が得られない可能性がある.モデル1 では 53#53 となるモデル2 の特殊な場合であると考えられる.モデル1 は 最適解に必ず収束するため,モデル1 を用いることで最適解を得ることができる.



root 平成24年3月22日