次へ: Model5
上へ: IBM翻訳モデル
戻る: Model3
目次
Model3では単語の位置は絶対位置で考えていたが,Model4では英単語と仏単語の位置を相対位置で表現する.また,Model3では各単語同士の位置は考慮に入れられていない.例えば,名詞と形容詞の出現位置を見たとき,英語における形容詞は名詞の前に出現するが,仏語では名詞の後ろに出現する性質がある.そのような場合を表現するため,英単語67#67
に対応する仏単語の位置をj,直前の英単語68#68
に対応する仏単語の位置をj'とし,その相対位置j -j'は,直前の英単語と仏単語のクラスに依存するとする.
繁殖数を考慮し,2つの場合を考える.ある繁殖数1以上の英単語に対応する仏単語のうち,最も文頭に近い単語をheadと呼ぶ.単語がheadのとき,Model3の歪み確率
69#69
は2.19式のようになる.
71#71
は直前の繁殖数が0でない英単語,j'は
71#71
に対応する仏単語の位置を表す.ただし,複数の仏単語が対応している場合,その単語の位置の平均をとった整数値とする.classは単語クラス50前後の種類を用いる.
次に単語がheadでない場合,単語のクラスのみに依存するとし,2.20式のような式となる.ただし,このときのj'は同じ英単語に対応付けられている,直前に出現した仏単語の位置とする.
Model4もModel3と同様の方法で推定を行うことができる.Model3のビタビアライメントから近傍を取ることで,Model4のビタビアライメントを求める.
平成24年3月23日