は日本語文の文長を示す.また,
は日本語文の1単語目から
-1単語目までの
アライメントである.そして
は日本語文の1番目から
-1番目までの単語を示す.
ここで,モデル1では以下を仮定している.
以上の仮定を用いて,
と
は以下のように表される.
モデル1において,翻訳確率
の初期値が0でない場合には,
EMアルゴリズムを用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.
ここで,日英の対訳文の文数を
文とする.
![]() |
(2.8) |
![]() |
(2.9) |
![]() |
![]() |
![]() |
(2.10) |
![]() |
![]() |
(2.11) |