モデル1

次へ: モデル2 上へ: IBM翻訳モデル 戻る: IBM翻訳モデル目次

モデル1

式(2.1)は以下の式に置き換えられる.

13#13

(2.2)

(2.2)式は複雑なため計算が困難である．そこで，モデル1では以下の過程により，パラメータの簡略化を行う．フランス語文の長さの確率 14#14 はm，Eに依存しない.

15#15

アライメントの確率は英語文の長さl に依存する．

16#16

フランス語の翻訳確率 17#17 は，仏単語 18#18 に対応する英単語 19#19 に依存する．

20#20

パラメータの簡略化を行うことで， 21#21 と22#22 は以下の式で表される．

23#23	24#24	25#25	(2.3)
26#26	24#24	27#27	(2.4)
28#28	24#24	29#29	(2.5)

モデル1 では翻訳確率 30#30 の初期値が0 以外の場合，Expectation-Maximization(EM) アルゴリズムを繰り返し行うことで得られる期待値を用いて最適解を推定する．EM アルゴリズムの手順を以下に示す．
手順1
翻訳確率 30#30 の初期値を設定する．
手順2
仏英対訳対 31#31 (但し， 32#32 )において，仏単語fと英単語eが対応する回数の期待値を以下の式により計算する．

33#33

(2.6)

手順3　
英語文34#34 のなかで1回以上出現する英単語eに対して，翻訳確率 30#30 を計算する． 1．定数35#35 を以下の式により計算する．

36#36

(2.7)

2.(2.6)式より求めた35#35 を用いて，翻訳確率 30#30 を再計算する.

37#37	24#24	38#38
28#28	24#24	39#39	(2.8)

手順4
翻訳確率 30#30 が収束するまで手順2と手順3を繰り返す．

次へ: モデル2 上へ: IBM翻訳モデル 戻る: IBM翻訳モデル目次

root 平成24年3月22日