next up previous contents
次へ: モデル3 上へ: 翻訳モデル 戻る: モデル1   目次

モデル2

モデル1では,全ての単語の対応に対して,英語文の長さ$ l$ にのみ依存し,単語対応の確率を一定としている.そこで,モデル2では,$ i$ 番目の日本語単語$ j_i$ と対応する英語単語の位置 $ a_i$ は英語文の長さ$ l$ に加えて,$ i$ と,日本語文の長さ$ m$ に依存し,以下のような関係とする.

$\displaystyle a(a_i\vert i, m, l) \equiv P(a_i\vert a^{i-1}_1, j^{i-1}_1, m, l)$ (2.9)

この関係からモデル1における式(2.5)は,以下の式に変換できる.

\begin{displaymath}\begin{split}P(J\vert E) &= \epsilon \sum^l_{a_1=0} \cdots \s...
...\sum^l_{k=0} t(j_i\vert e_{a_i})a(a_i\vert i, m, l) \end{split}\end{displaymath} (2.10)

モデル2では,期待値は $ c(j\vert e;J,E)$ $ c(k\vert i,m,l;J,E)$ の2つが存在する.以下の式から求められる.

\begin{displaymath}\begin{split}c(j\vert e;J,E) &= \frac{t(j\vert e)}{t(j\vert e...
...rt i,m,l) + \cdots + t(j\vert e_l) a(l\vert i,m,l)} \end{split}\end{displaymath} (2.11)

\begin{displaymath}\begin{split}c(k\vert i,m,l;J,E) &= \sum_a P(a\vert E,J) \del...
...t i,m,l) + \cdots + t(j_i\vert e_l)a(l\vert i,m,l)} \end{split}\end{displaymath} (2.12)

$ c(j\vert e;J,E)$ は対訳文中の英語単語$ e$ と日本語単語$ j$ が対応付けされる回数の期待値, $ c(k\vert i,m,l;J,E)$ は英語単語の位置$ k$ が日本語単語の位置$ i$ に対応付けされる回数の期待値を表している.

モデル2では,EMアルゴリズムで計算すると複数の極大値が算出され,最適解が得られない可能性がある.モデル1では $ a(k\vert i,m,l)=({l+1})^{-1}$ となるモデル 2の特殊な場合であると考えられる.したがって,モデル1を用いることで最適解を得ることができる.



平成27年3月13日