次へ: モデル2
上へ: IBM翻訳モデル
戻る: IBM翻訳モデル
目次
(3.3)式は以下の式に分解することが出来る.はフランス語文の長
さ,はフランス語文における,1番目から番目までのアライメン
ト,はフランス語文における,1番目から番目まで単語
を表している.
|
|
|
(3.4) |
(3.4)式ではとても複雑であるので計算が困難である.そこで,モデル1
では以下の仮定により,パラメータの簡略化を行う.
- フランス語文の長さの確率は, に依存しない
- アライメントの確率は英語文の長さに依存する
- フランス語の翻訳確率
は,仏単語に対応する英
単語に依存する
パラメータの簡略化を行うことで,とは以下の式で表
される.
モデル1では翻訳確率の初期値が0以外の場合,
Expectation-Maximization(EM)アルゴリズムを繰り返し行うことで得られる期待
値を用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.
- 手順1
-
翻訳確率の初期値を設定する.
- 手順2
-
仏英対訳対
(但し,
)において,仏単語と英単語が対応す
る回数の期待値を以下の式により計算する.
|
|
|
(3.8) |
はフランス語文中で仏単語
が出現する回数,
は英語文中で英単語
が出現する回数を表している.
- 手順3
-
英語文の中で1回以上出現する英単語
に対して,翻訳確率を計算する.
- 定数を以下の式により計算する.
|
|
|
(3.9) |
- (3.9)式より求めたを用いて,翻訳確率を
再計算する.
- 手順4
-
翻訳確率が収束するまで手順2と手順3を繰り返す.
次へ: モデル2
上へ: IBM翻訳モデル
戻る: IBM翻訳モデル
目次
平成22年2月11日