next up previous contents
次へ: モデル4 上へ: 翻訳モデル 戻る: モデル2   目次

モデル3

モデル3は,英語単語と仏単語の対応は1対1の場合のみを想定していたモデル1,モデル2とは異なり,1つの単語が複数対応する単語の繁殖数や単語の翻訳位置の歪みについて考慮する.またモデル3では単語の位置を絶対位置として考える.モデル3では以下の3つのパラメータを用いる.

さらに,英単語が仏単語に翻訳されない個数を$ \phi_0$ とし,その確率 $ p_0$ を以下の式で求める.このとき,歪み確率は $ \frac{1}{\phi_0!}$ で, $ p_0 + p_1 = 1$$ p_0$$ p_1$ は0より大きいとする.


\begin{displaymath}P(\phi_0\vert\phi^l_1,E) = \left(
\begin{array}{c}
\phi_1 + \...
...ay}\right) p_0^{\phi_1 + \cdots + \phi_l - \phi_0} p_1^{\phi_0}\end{displaymath}     (18)

以上により,モデル3は以下の式で求められる.


$\displaystyle P(F\vert E)$ $\displaystyle =$ $\displaystyle \sum^l_{a_1=0} \cdots \sum^l_{a_m=0} P(F,a\vert E)$ (19)
  $\displaystyle =$ \begin{displaymath}\sum^l_{a_1=0} \cdots \sum^l_{a_m=0}
\left(
\begin{array}{c}...
...-2\phi_0} p_1^{\phi_0} \prod^l_{i=1} \phi_i! n(\phi_i\vert e_i)\end{displaymath}  
  $\displaystyle \times$ $\displaystyle \prod^m_{j=1} t(f_j\vert e_{a_j}) d(j\vert a_j,m,l)$ (20)

モデル3では,全てのアライメントを計算するため,計算量が膨大となる.そのため,期待値を 近似により求める.



平成23年4月12日