IBMモデル

次へ: GIZA++ 上へ: 単語対応の獲得 戻る: 単語対応の獲得目次

IBMモデル

SMTにおける単語対応を得るための代表的なモデルとして，IBMモデルがある． IBMモデルはmodel1からmodel5までの5つのモデルからなる． IBMモデルでは原言語の日本語文

，目的言語の英語文

の翻訳モデル $P(J\vert E)$ を計算するため，アライメント

を用いる．以下にIBMモデルの基本的な計算式を示す．

$\displaystyle P(J\vert E) = \sum_{a}P(J,a\vert E)$

(3.1)

ここで，アライメントは，日本語単語と英単語の対応関係を意味している．IBMモデルにおいて，各日本語単語に対応する英単語は1つであるのに対して，各英単語に対応する日本語単語は0からn個あると仮定する．また，日本語単語と適切な英単語が対応しない場合，英語文の先頭に $e_{0}$ という空単語があると仮定し，日本語単語を対応させる．

平成25年2月13日