・モデル1

Next: ・モデル2 Up: IBM翻訳モデル Previous: IBM翻訳モデル目次

(

)式は以下の式に分解することができる．10#10はフランス語文の長さ，11#11はフランス語文における，1番目から12#12番目までのアライメント，13#13はフランス語文における，1番目から12#12番目まで単語を表している．

14#14

(2.2)

(

)式ではとても複雑であるので計算が困難である．そこで，モデル1 では以下の仮定により，パラメータの簡略化を行う．

パラメータの簡略化を行うことで，24#24と25#25は以下の式で表される．

モデル1では翻訳確率32#32の初期値が0以外の場合， Expectation-Maximization(EM)アルゴリズムを繰り返し行うことで得られる期待値を用いて最適解を推定する．EMアルゴリズムの手順を以下に示す．

手順1

翻訳確率32#32の初期値を設定する．

手順2

仏英対訳対 33#33(但し， 34#34)において，仏単語7#7と英単語8#8が対応する回数の期待値を以下の式により計算する．

35#35

(2.6)

36#36はフランス語文37#37中で仏単語 7#7が出現する回数， 38#38は英語文16#16中で英単語8#8 が出現する回数を表している．

手順3

英語文39#39の中で1回以上出現する英単語8#8に対して，翻訳確率32#32を計算する．

手順4

翻訳確率32#32が収束するまで手順2と手順3を繰り返す．

Next: ・モデル2 Up: IBM翻訳モデル Previous: IBM翻訳モデル目次

s122036 2016-03-17

42#42	27#27	43#43
	27#27	44#44	(2.8)