next up previous contents
次へ: Model1 上へ: 翻訳モデル 戻る: 翻訳モデルの概要   目次

IBM翻訳モデル

統計翻訳で代表的なモデルとして,Brownらが提案したフランス語英語翻訳モデルがある.この翻訳モデルは,提案したBrownら全員がIBMの社員であったため,通称IBM翻訳モデル(IBM Model)といわれる.IBM翻訳モデルは,Model1からModel5まで5つのモデルからなり,順に複雑な計算となる.第2.3.2章の説明では,翻訳する言語をフランス語f,目的言語を英語eと想定して行う.

IBM翻訳モデルでは,フランス語文fと英語文eの翻訳モデル$P(f\vert e)$を計算するために,アライメント$\alpha$を用いる.(2.3)にIBM翻訳モデルの基本的な計算式を示す.


$\displaystyle P(f\vert e)=\sum_{a}P(f,a\vert e)$     (3.3)

アライメント$\alpha$はフランス単語fと英単語eにおける対応関係を示す.IBM翻訳モデルにおけるアライメントは,フランス語側の各単語fにおいて,それぞれ英語側に対応する単語eが一つある.また,英語側の各単語eは,フランス語側に対応する単語fが0〜n個ある.また,フランス単語fにおいて,適切な英単語eとの対応関係がなかった場合,英語文の先頭に$e_{0}$という空単語があると仮定し,そのフランス語と空単語$e_{0}$を対応づける.フランス語英語翻訳におけるアライメントの例を図2.2に示す.

図: アライメントの例
\fbox{
\includegraphics*[clip,width=10cm]{align.eps}
}

$\alpha$ $\alpha_{1}^{n}=\alpha_{1},\alpha{2},...,\alpha_{n}$である.また,$\alpha_{1}$は,$f_{1}$の単語Leと$e_{a_{1}=1}$の単語Theにおける対応関係を表す.


平成21年3月19日