next up previous contents
Next: ・モデル3 Up: IBM翻訳モデル Previous: ・モデル1   目次

・モデル2

モデル1では,全ての単語の対応に対して,英語文の長さ18#18にのみ依存し,単語対応の確率を一定としている. そこで,モデル2では,45#45番目の仏単語21#21と対応する英単語の位置 46#46は英語文の長さ18#18に加えて,45#45と,フランス語文の長さ10#10に依 存し,以下のような関係とする.
47#47     (2.9)

この関係からモデル1における([*])式は,以下の式に変換できる.

29#29 27#27 48#48 (2.10)
  27#27 49#49 (2.11)

モデル2では,期待値は50#50と 51#51の2つが存在する.以下の式から求められる.

52#52 27#27 53#53 (2.12)
  27#27 54#54 (2.13)
55#55 27#27 56#56 (2.14)
  27#27 57#57 (2.15)


58#58は対訳文中の英単語8#8と仏単語7#7が対応付けされる回数の 期待値, 51#51は英単語の位置59#59が仏単語の位置45#45に対応付 けされる回数の期待値を表している.

モデル2では,EMアルゴリズムで計算すると複数の極大値が算出され,最適解が 得られない可能性がある.モデル1では 60#60となるモデル 2の特殊な場合であると考えられる.したがって,モデル1を用いることで最適解 を得ることができる.



s122036 2016-03-17