Model3

Next: Model4 Up: IBM翻訳モデル Previous: Model2 目次

Model3

Model1およびModel2において，日単語と英単語の対応は1対1の場合のみを考慮していた．しかし，Model3では，1つの単語が複数の単語に対応する場合や，単語の翻訳位置の距離についても考慮する．また，Model3では単語の位置を絶対位置として考えている．Model3では以下のパラメータを用いる．

$P(j\vert e)$
英単語が日単語に翻訳される確率
$n(\phi\vert e)$
英単語が $\phi$ 個の日単語と対応する確率
$d(j\vert i,m,l)$
英語文の長さ，日本語文の長さのとき，番目の英単語 $e_{i}$ が番目の日単語 $j_{j}$ に翻訳される確率

さらに，英単語に翻訳されない日本語の単語数を $\phi_{0}$ として，そのような単語が発生する確率 $p_{0}$ を以下の式に表す．

$\begin{displaymath}P(\phi_{0}\vert\phi_{1}^{l},e) = \left( \begin{array}{c} \ph... ...0}^{\phi_{1} ＋ \cdots ＋ \phi_{l} － \phi_{0}}p_{1}^{\phi_{0}}\end{displaymath}$

(2.15)

したがって，Model3は以下の式によって表される．

$\displaystyle P(j\vert e)$	$\displaystyle =$	$\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}P(j,a\vert e)$	(2.16)
	$\displaystyle =$	$\begin{displaymath}\sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l} \left( \begin{a... ...\phi_{0}} \prod_{i=1}^{l}\phi_{i}!n(\phi_{i}\vert e_{i}) \times\end{displaymath}$
		$\displaystyle \hspace*{2zw} \prod_{j=1}^{m}t(j_{j}\vert e_{a_{j}})d(j\vert a_{j},m,l)$	(2.17)

Model3では，全ての単語対応を考慮して計算するため，計算量が膨大となる．そのため，期待値は近似によって求められる．

2019-03-08