next up previous contents
次へ: モデル4 上へ: IBM翻訳モデル 戻る: モデル2   目次

モデル3

モデル1およびモデル2において,日単語と英単語の対応は1対1の場合のみを考慮していた. しかし,モデル3では,1つの単語が複数の単語に対応する場合や,単語の翻訳位置の距離についても考慮する. また,モデル3では単語の位置を絶対位置として考えている.モデル3では以下のパラメータを用いる. さらに,英単語に翻訳されない日本語の単語数を$ \phi_{0}$ として,そのような単語が発生する確率$ p_{0}$ を以下の式に表す.


\begin{displaymath}P(\phi_{0}\vert\phi_{1}^{l},e) =
\left(
\begin{array}{c}
\ph...
...0}^{\phi_{1} + \cdots + \phi_{l} − \phi_{0}}p_{1}^{\phi_{0}}\end{displaymath}     (2.17)

したがって,モデル3は以下の式によって表される.


$\displaystyle P(J\vert E)$ $\displaystyle =$ $\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}P(J,a\vert E)$ (2.18)
  $\displaystyle =$ \begin{displaymath}\sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}
\left(
\begin{a...
...\phi_{0}}
\prod_{i=1}^{l}\phi_{i}!n(\phi_{i}\vert e_{i}) \times\end{displaymath}  
    $\displaystyle \hspace*{2zw} \prod_{k=1}^{m}t(j_{k}\vert e_{a_{k}})d(k\vert a_{k},m,l)$ (2.19)

モデル3では,全ての単語対応を考慮して計算するため,計算量が膨大となる.そのため,期待値は近似によって求められる.



平成25年2月12日