next up previous contents
次へ: GIZA++ 上へ: 翻訳モデル 戻る: 翻訳モデル   目次

IBMモデル

翻訳モデルの代表例としてIBM翻訳モデル[7]がある. IBMモデルは英語文 $e$ ,日本語文 $j$ の翻訳モデル $P(j\vert e)$ を計算するためにアラインメント $a$ と呼ばれる概念を導入し,以下のような式を考える. なお,アラインメントとは,ある日本語単語 $j$ と英単語 $e$ の対応関係のことを示す.


$\displaystyle P(j \mid e)$ $\textstyle =$ $\displaystyle \sum_{\it a} P(j,a \mid e)$  

IBMモデルでは,日英統計翻訳の場合,英単語は1対$n$ の対応を持ち,日本語の単語は1つの英単語のみと対応すると仮定する. また,日本語の単語の対応関係として適切な英単語がなかった場合,英語文の文頭の特殊文字$e$と対応付けを行う.



平成25年2月12日