next up previous contents
次へ: Model5 上へ: IBM翻訳モデル 戻る: Model3   目次

Model4

Model3では単語の位置は絶対位置で考えていたが,Model4では英単語と仏単語の位置を相対位置で表現する.また,Model3では各単語同士の位置は考慮に入れられていない.例えば,名詞と形容詞の出現位置を見たとき,英語における形容詞は名詞の前に出現するが,仏語では名詞の後ろに出現する性質がある.そのような場合を表現するため,英単語67#67 に対応する仏単語の位置をj,直前の英単語68#68 に対応する仏単語の位置をj'とし,その相対位置j -j'は,直前の英単語と仏単語のクラスに依存するとする.

繁殖数を考慮し,2つの場合を考える.ある繁殖数1以上の英単語に対応する仏単語のうち,最も文頭に近い単語をheadと呼ぶ.単語がheadのとき,Model3の歪み確率 69#69 は2.19式のようになる.


70#70     (2.19)

71#71 は直前の繁殖数が0でない英単語,j' 71#71 に対応する仏単語の位置を表す.ただし,複数の仏単語が対応している場合,その単語の位置の平均をとった整数値とする.classは単語クラス50前後の種類を用いる.

次に単語がheadでない場合,単語のクラスのみに依存するとし,2.20式のような式となる.ただし,このときのj'は同じ英単語に対応付けられている,直前に出現した仏単語の位置とする.


72#72     (2.20)

Model4もModel3と同様の方法で推定を行うことができる.Model3のビタビアライメントから近傍を取ることで,Model4のビタビアライメントを求める.



平成24年3月23日