次へ: モデル2
上へ: IBM翻訳モデル
戻る: IBM翻訳モデル
目次
式2.3は以下の式に置き換えられる.
|
|
|
(2.4) |
は日本語文の文長を示す.また,
は日本語文の1単語目から
-1単語目までの
アライメントである.そして
は日本語文の1番目から
-1番目までの単語を示す.
ここで,モデル1では以下を仮定している.
以上の仮定を用いて,
と
は以下のように表される.
モデル1において,翻訳確率
の初期値が0でない場合には,
EMアルゴリズムを用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.
ここで,日英の対訳文の文数を
文とする.
- 手順1
-
に初期値を設定する
- 手順2
- 日本語と英語の対訳文(
,
)(
)において,日単語
と英単語
が対応付けられる回数の期待値を求める.
ここで
は日本語文
において日単語
が出現する回数を表す.そして
は英語文
において英単語
が出現する回数を表す.
|
|
|
(2.8) |
- 手順3
- 英語文
において,1回以上出現する英単語
に対して,翻訳確率
を計算する.
- 定数
を以下の式で計算する
|
|
|
(2.9) |
- 上式で求めた定数
を用いて
を以下の式で再計算する
- 手順4
-
が収束するまで,手順2と手順3を繰り返す
次へ: モデル2
上へ: IBM翻訳モデル
戻る: IBM翻訳モデル
目次
平成25年2月12日