model1

式(3)は以下の式に置き換えられる.
    (11)

は日本語文の文長を示す.また,は日本語文の1単語目から-1単語目までのアライメントである. そしては日本語文の1番目から-1番目までの単語を示す. ここで,Model1では以下を仮定している.

以上の仮定を用いて,式(4)は簡略化することができる.以下に式を示す.

(12)
(13)
  (14)

model1において,翻訳確率の初期値が0でない場合, EMアルゴリズムを用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.

手順1
に初期値を設定する.
手順2
日本語と英語の対訳文()( )において,日単語と英単語が対応付けられる回数の期待値を求める. ここで は日本語文において日単語が出現する回数を表す.そして は英語文において英単語が出現する回数を表す.
    (15)

手順3
英語文において,1回以上出現する英単語に対して,翻訳確率を計算する.

手順4
が収束するまで,手順2と手順3を繰り返す.

s142006 2018-03-06