next up previous contents
Next: ・モデル2 Up: IBM翻訳モデル Previous: IBM翻訳モデル   目次

・モデル1

([*])式は以下の式に分解することができる.10#10はフランス語文の長 さ,11#11はフランス語文における,1番目から12#12番目までのアラ イメント,13#13はフランス語文における,1番目から12#12番目まで 単語を表している.
14#14     (2.2)

([*])式ではとても複雑であるので計算が困難である.そこで,モデル1 では以下の仮定により,パラメータの簡略化を行う.

パラメータの簡略化を行うことで,24#24と25#25は以下の式で表 される.


26#26 27#27 28#28 (2.3)
29#29 27#27 30#30 (2.4)
  27#27 31#31 (2.5)

モデル1では翻訳確率32#32の初期値が0以外の場合, Expectation-Maximization(EM)アルゴリズムを繰り返し行うことで得られる期待 値を用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.

手順1
翻訳確率32#32の初期値を設定する.

手順2
仏英対訳対 33#33(但し, 34#34)において,仏単語7#7と英単語8#8が対応する回数の期待値を以下の式により計算する.
35#35     (2.6)

36#36はフランス語文37#37中で仏単語 7#7が出現する回数, 38#38は英語文16#16中で英単語8#8 が出現する回数を表している.

手順3
英語文39#39の中で1回以上出現する英単語8#8に対して,翻訳確率32#32を計算する.

  1. 定数40#40を以下の式により計算する.
    41#41     (2.7)

  2. ([*])式より求めた40#40を用いて,翻訳確率32#32を再計算する.
    42#42 27#27 43#43  
      27#27 44#44 (2.8)

手順4
翻訳確率32#32が収束するまで手順2と手順3を繰り返す.


next up previous contents
Next: ・モデル2 Up: IBM翻訳モデル Previous: IBM翻訳モデル   目次
s122036 2016-03-17