次へ: モデル2
上へ: 翻訳モデル
戻る: IBMモデル
目次
式(3)は以下の式に分解することが出来る.
はフランス語文の長さ,
はフランス語文における,1番目から
番目までのアライメント,
はフランス語文における,1番目から
番目まで単語を表している.
![$\displaystyle P(F, a\vert E) = P(m\vert E) \prod_{j=1}^m P(a_j\vert a_1^{j-1}, f_1^{j-1}, m, E)
P(f_j\vert a_1^j, f_1^{j-1}, m, E)$](img24.png) |
|
|
(4) |
このままでは複雑であるあるため計算が困難である.そこで,モデル1では以下のように仮定し,簡略化を行う.
- フランス語文の長さの確率は
,
に依存しないとし,定数
で置く
- アライメントの確率は英語文の長さ
のみに依存する
- フランス語の翻訳確率
は,仏単語
に対応付けられる英単語
のみに依存する
以上の簡略化を行うことで,
と
は以下の式で表
される.
モデル1では翻訳確率
の初期値が0以外の場合,以下のようなEMアルゴリズムを繰り返し行うことで得られる期待値を用いて最適解を推定する.
- 1.
- 翻訳確率
に適当な初期値を設定する.
- 2.
- 仏英対訳対
(但し,
)において,仏単語
と英単語
が対応す
る回数の期待値を以下の式により計算する.
![$\displaystyle c(f\vert e;F,E) = \frac{t(f\vert e)}{t(f\vert e_0) + \cdots + t(f\vert e_l)} \sum^m_{j=1}
\delta(f, f_j) \sum^l_{i=0} \delta(e, e_i)$](img43.png) |
|
|
(8) |
はフランス語文
中で仏単語
が出現する回数,
は英語文
中で英単語
が出現する回数を表している.
- 3.
- 英語文
の中で1回以上出現する英単語
に対して,翻訳確率
を計算する.
- 定数
を以下の式により計算する.
![$\displaystyle \lambda_e = \sum_f \sum^S_{s=1} c(f\vert e; F^{(s)}, E^{(s)})$](img48.png) |
|
|
(9) |
- (9)式より求めた
を用いて,翻訳確率
を
再計算する.
- 4.
-
翻訳確率
が収束するまで手順2と手順3を繰り返す.
次へ: モデル2
上へ: 翻訳モデル
戻る: IBMモデル
目次
平成23年4月12日