next up previous contents
次へ: Model4 上へ: IBM翻訳モデル 戻る: Model2   目次

Model3

Model1,Model2では,英単語とフランス単語の対応は1対1の場合のみと想定して いた.しかしながら,実際の翻訳では,複数の単語が1つの単語に翻訳されるこ とが考えられる.そこで,Model3では,ある英単語がフランス単語に何個対応す るのかを考慮し,さらに,対応する英単語とフランス単語が近い位置にあるとは限 らないので,英単語とフランス単語の距離も考慮する.これらの場合を想定し, 以下の3つのパラメータを用いる. これに加えて,英単語に翻訳されないフランス単語の数を$\phi_{0}$とし,その 確率$p_{0}$を以下の式によって求める.
$\displaystyle P(\phi_{0}\vert\phi_{1}^{l},e) =
\left(
\begin{array}{c}
\phi_{1}...
...rray}\right)
p_{0}^{\phi_{1} + \cdots + \phi_{l} − \phi_{0}}p_{1}^{\phi_{0}}$     (17)

上式より,Model3は以下の式で表すことができる.


$\displaystyle P(f\vert e)$ $\textstyle =$ $\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}P(f,a\vert e)$ (18)
  $\textstyle =$ $\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}
\left(
\begin{array}...
...\phi_{0}}p_{1}^{\phi_{0}}
\prod_{i=1}^{l}\phi_{i}!n(\phi_{i}\vert e_{i}) \times$  
    $\displaystyle \hspace*{2zw} \prod_{j=1}^{m}t(f_{j}\vert e_{a_{j}})d(j\vert a_{j},m,l)$ (19)

Model3は,Model1やModel2と異なり,効率的に計算できず,全ての単語対応を 考慮すると計算量が莫大であるため,期待値は近似によって求める.また,英単語 とフランス単語の位置は絶対位置として考える.



平成22年2月11日