next up previous contents
次へ: Model1 上へ: 日英統計翻訳システム 戻る: 翻訳モデル   目次

IBM翻訳モデル

統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデル [2]がある.この翻訳モデルは,model1からmodel5までの5つのモデルか ら構成され,順に複雑になっていく.IBM翻訳モデルでは,フランス語から英語 への翻訳を想定しているため,以下の説明では仏英翻訳を前提とする.本章では. 原言語であるフランス語文を$f$,目的言語である英語文を$e$として定義する.
IBMモデルでは,フランス語文$e$,英語文$f$の翻訳モデル$P(F\vert E)$を計算するため に,アライメント$a$を用いる.以下にIBMモデルの基本式を示す.
$\displaystyle P(f\vert e) = \sum_{a}P(f,a\vert e)$     (3)

アライメント$a$は,フランス単語$F$と英単語$E$の対応関係を示す.IBMモ デルにおいて,英単語は1:nの対応をもち,フランス単語は1:1の対応をもつと仮 定する.またフランス単語に適切な対応関係をもつ英単語が存在しなかった場合 には,英語文の先頭に$e_0$という特殊文字があると仮定し,そのフランス単語 と特殊文字を対応させる.



Subsections

平成22年2月11日