next up previous contents
次へ: GIZA++ 上へ: 単語に基づく統計翻訳 戻る: 単語に基づく統計翻訳   目次

IBM翻訳モデル

統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデル[5]がある.IMB翻訳モデルは,単語に基づく統計翻訳を想定して作成された,単語対応の確率モデルである.IBM翻訳モデルでは,フランス語から英語への翻訳を想定しているため,以下の説明では仏英翻訳を前提とする.本章では.原言語であるフランス語文を$f$,目的言語である英語文を$e$として定義する.
IBMモデルでは,フランス語文$e$,英語文$f$の翻訳モデル$P(F\vert E)$を計算するために,アライメント$a$を用いる.以下にIBMモデルの基本式を示す.
$\displaystyle P(f\vert e) = \sum_{a}P(f,a\vert e)$     (3.3)

アライメント$a$は,フランス語単語$F$と英単語$E$の対応関係を示す.IBMモデルにおいて,英単語は1:nの対応をもち,フランス語単語は1:1の対応をもつと仮定する.またフランス語単語に適切な対応関係をもつ英単語が存在しなかった場合,英語文の先頭に$e_0$という特殊文字があると仮定する.そして,フランス語単語と特殊文字の対応付けを行う.



eki takashi 平成24年3月13日