![]() |
(2.4) |
は日本語の文長であり,
は日本語文の1単語目から
単語目までのアライメントである.また,
は日本語文の1番目から
番目までの単語を示す.
(2.4)式の右辺は,パラメータが多く複雑なため,計算が困難である.そこで,Model1では(2.4)式のパラメータを簡略化する.
これらの定理を用いて,パラメータを簡略化した場合の,
は以下になる.
![]() |
![]() |
![]() |
(2.5) |
![]() |
![]() |
![]() |
(2.6) |
![]() |
![]() |
(2.7) |
Model1は,翻訳確率の初期値が0以外の時,EMアルゴリズムを繰り返して得られる唯一の極大値より最適解を推定する.EMアルゴリズムは以下の手順で行われる.
![]() |
(2.8) |
![]() |
(2.9) |
![]() |
![]() |
![]() |
|
![]() |
![]() |
(2.10) |