next up previous contents
次へ: GIZA++ 上へ: 単語対応の獲得 戻る: 単語対応の獲得   目次


IBMモデル

SMTにおける単語対応を得るための代表的なモデルとして,IBMモデルがある. IBMモデルはmodel1からmodel5までの5つのモデルからなる. IBMモデルでは原言語の日本語文$ J$ ,目的言語の英語文$ E$ の翻訳モデル$ P(J\vert E)$ を計算するため,アライメント$ a$ を用いる.以下にIBMモデルの基本的な計算式を示す.


$\displaystyle P(J\vert E) = \sum_{a}P(J,a\vert E)$     (3.1)

ここで,アライメント$ a$ は,日本語単語$ j$ と英単語$ e$ の対応関係を意味している.IBMモデルにおいて,各日本語単語に対応する英単語は1つであるのに対して,各英単語に対応する日本語単語は0からn個あると仮定する.また,日本語単語と適切な英単語が対応しない場合,英語文の先頭に$ e_{0}$ という空単語があると仮定し,日本語単語を対応させる.



平成25年2月13日