次へ: Model4
上へ: IBM翻訳モデル
戻る: Model2
目次
Model1,Model2では,英単語とフランス単語の対応は1対1の場合のみと想定して
いた.しかしながら,実際の翻訳では,複数の単語が1つの単語に翻訳されるこ
とが考えられる.そこで,Model3では,ある英単語がフランス単語に何個対応す
るのかを考慮し,さらに,対応する英単語とフランス単語が近い位置にあるとは限
らないので,英単語とフランス単語の距離も考慮する.これらの場合を想定し,
以下の3つのパラメータを用いる.
- 翻訳確率
フランス単語が英単語に翻訳される確率
- 繁殖確率
英単語が個のフランス語に対応する確率
- 歪み確率
フランス語文の長さが,英語文の長さがのとき,単語位置の英単語が
単語位置のフランス単語に翻訳される確率
これに加えて,英単語に翻訳されないフランス単語の数をとし,その
確率を以下の式によって求める.
|
|
|
(17) |
上式より,Model3は以下の式で表すことができる.
Model3は,Model1やModel2と異なり,効率的に計算できず,全ての単語対応を
考慮すると計算量が莫大であるため,期待値は近似によって求める.また,英単語
とフランス単語の位置は絶対位置として考える.
平成22年2月11日