13#13 | (2.2) |
(2.2)式は複雑なため計算が困難である.そこで,モデル1では以下の過程により,パラメータの簡略化を行う. フランス語文の長さの確率 14#14 はm,Eに依存しない.
15#15 |
アライメントの確率は英語文の長さl に依存する.
16#16 |
フランス語の翻訳確率 17#17 は,仏単語 18#18 に対応する英単語 19#19 に依存する.
20#20 |
パラメータの簡略化を行うことで, 21#21 と22#22 は以下の式で表される.
23#23 | 24#24 | 25#25 | (2.3) |
26#26 | 24#24 | 27#27 | (2.4) |
28#28 | 24#24 | 29#29 | (2.5) |
モデル1 では翻訳確率
30#30
の初期値が0 以外の場合,Expectation-Maximization(EM)
アルゴリズムを繰り返し行うことで得られる期待値を用いて最適解を推定する.EM ア
ルゴリズムの手順を以下に示す.
手順1
翻訳確率
30#30
の初期値を設定する.
手順2
仏英対訳対
31#31
(但し,
32#32
)において,仏単語fと英単語eが対応する回数の期待値を以下の式により計算する.
33#33 | (2.6) |
36#36 | (2.7) |
2.(2.6)式より求めた35#35
を用いて,翻訳確率
30#30
を再計算する.
37#37 | 24#24 | 38#38 | |
28#28 | 24#24 | 39#39 | (2.8) |