model3

次へ: model4 上へ: IBM翻訳モデル 戻る: model2 目次

model3

model1およびmodel2において，日単語と英単語の対応は1対1の場合のみを考慮していた．しかし，model3では，1つの単語が複数の単語に対応する場合や，単語の翻訳位置の距離についても考慮する．また，モデル3では単語の位置を絶対位置として考えている．モデル3では以下のパラメータを用いる．

$P(j\vert e)$
英単語が日単語に翻訳される確率
$n(\phi\vert e)$
英単語が $\phi$ 個の日単語と対応する確率
$d(j\vert i,m,l)$
英語文の長さ，日本語文の長さのとき，番目の英単語 $e_{i}$ が番目の日単語 $j_{j}$ に翻訳される確率

さらに，英単語に翻訳されない日本語の単語数を $\phi_{0}$ として，そのような単語が発生する確率 $p_{0}$ を以下の式に表す．

$\displaystyle P(\phi_{0}\vert\phi_{1}^{l},e) = \left( \begin{array}{c} \phi_{1... ...rray}\right) p_{0}^{\phi_{1} ＋ \cdots ＋ \phi_{l} － \phi_{0}}p_{1}^{\phi_{0}}$

(17)

したがって，model3は以下の式によって表される．

$\displaystyle P(j\vert e)$	$\textstyle =$	$\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l}P(j,a\vert e)$	(18)
	$\textstyle =$	$\displaystyle \sum_{a_{1}=0}^{l} \cdots \sum_{a_{m}=0}^{l} \left( \begin{array... ...\phi_{0}}p_{1}^{\phi_{0}} \prod_{i=1}^{l}\phi_{i}!n(\phi_{i}\vert e_{i}) \times$
		$\displaystyle \hspace*{2zw} \prod_{j=1}^{m}t(j_{j}\vert e_{a_{j}})d(j\vert a_{j},m,l)$	(19)

モデル3では，全ての単語対応を考慮して計算するため，計算量が膨大となる．そのため，期待値は近似によって求められる．

平成23年3月3日