Next: Model4
Up: IBM翻訳モデル
Previous: Model2
目次
Model1およびModel2において,日単語と英単語の対応は1対1の場合のみを考慮していた.
しかし,Model3では,1つの単語が複数の単語に対応する場合や,単語の翻訳位置の距離についても考慮する.
また,Model3では単語の位置を絶対位置として考えている.Model3では以下のパラメータを用いる.
-
英単語
が日単語
に翻訳される確率
-
英単語
が
個の日単語と対応する確率
-
英語文の長さ
,日本語文の長さ
のとき,
番目の英単語
が
番目の日単語
に翻訳される確率
さらに,英単語に翻訳されない日本語の単語数を
として,そのような単語が発生する確率
を以下の式に表す.
![\begin{displaymath}P(\phi_{0}\vert\phi_{1}^{l},e) =
\left(
\begin{array}{c}
\ph...
...0}^{\phi_{1} + \cdots + \phi_{l} − \phi_{0}}p_{1}^{\phi_{0}}\end{displaymath}](img64.png) |
|
|
(2.15) |
したがって,Model3は以下の式によって表される.
Model3では,全ての単語対応を考慮して計算するため,計算量が膨大となる.そのため,期待値は近似によって求められる.
2019-03-08