 
 
 
 
 
 
 
  
 Next: ・モデル2
 Up: IBM翻訳モデル
 Previous: IBM翻訳モデル
     目次 
(![[*]](crossref.png) )式は以下の式に分解することができる.10#10はフランス語文の長
さ,11#11はフランス語文における,1番目から12#12番目までのアラ
イメント,13#13はフランス語文における,1番目から12#12番目まで
単語を表している.
)式は以下の式に分解することができる.10#10はフランス語文の長
さ,11#11はフランス語文における,1番目から12#12番目までのアラ
イメント,13#13はフランス語文における,1番目から12#12番目まで
単語を表している.
(![[*]](crossref.png) )式ではとても複雑であるので計算が困難である.そこで,モデル1
では以下の仮定により,パラメータの簡略化を行う.
)式ではとても複雑であるので計算が困難である.そこで,モデル1
では以下の仮定により,パラメータの簡略化を行う.
- フランス語文の長さの確率15#15は10#10, 16#16に依存しない
 
 
 
- アライメントの確率は英語文の長さ18#18に依存する
 
 
 
- フランス語の翻訳確率
20#20は,仏単語21#21に対応する英単語22#22に依存する
 
 
 
パラメータの簡略化を行うことで,24#24と25#25は以下の式で表
される.
| 26#26 | 27#27 | 28#28 | (2.3) | 
| 29#29 | 27#27 | 30#30 | (2.4) | 
|  | 27#27 | 31#31 | (2.5) | 
 
モデル1では翻訳確率32#32の初期値が0以外の場合,
Expectation-Maximization(EM)アルゴリズムを繰り返し行うことで得られる期待
値を用いて最適解を推定する.EMアルゴリズムの手順を以下に示す.
- 手順1
- 翻訳確率32#32の初期値を設定する.
 
- 手順2
- 仏英対訳対
33#33(但し,
	   
34#34)において,仏単語7#7と英単語8#8が対応する回数の期待値を以下の式により計算する.
 
 
 
36#36はフランス語文37#37中で仏単語
	   7#7が出現する回数,
38#38は英語文16#16中で英単語8#8
	   が出現する回数を表している.
 
 
- 手順3
- 英語文39#39の中で1回以上出現する英単語8#8に対して,翻訳確率32#32を計算する.
 
- 定数40#40を以下の式により計算する.
 
 
 
- (![[*]](crossref.png) )式より求めた40#40を用いて,翻訳確率32#32を再計算する. )式より求めた40#40を用いて,翻訳確率32#32を再計算する.
 
| 42#42 | 27#27 | 43#43 |  |  |  | 27#27 | 44#44 | (2.8) |  
 
 
 
 
 
 
- 手順4
- 翻訳確率32#32が収束するまで手順2と手順3を繰り返す.
 
 
 
 
 
 
 
 
  
 Next: ・モデル2
 Up: IBM翻訳モデル
 Previous: IBM翻訳モデル
     目次 
s122036
2016-03-17