IBM翻訳モデル

次へ: GIZA++ 上へ: 単語に基づく統計翻訳 戻る: 単語に基づく統計翻訳の概要目次

IBM翻訳モデル

単語に基づく統計翻訳には，IBM社のBrownら[7]によって提案されたIBM翻訳モデルが用いられる． IBM翻訳モデルは，Model1からModel5までの5つから構成され，順に複雑な計算を行う．仏英翻訳で使用することを想定しているため，本節では，仏英翻訳を前提に説明を行う． IBM翻訳モデルでは，フランス語文

と英語文

の翻訳モデル $P(f\big\vert e)$ を計算するために，アライメント

を用いる． IBM翻訳モデルの基本式を以下に示す．

$\displaystyle P(f \mid e)$

$\textstyle =$

$\displaystyle \sum_{\it a} P(f,a \mid e)$

アライメントは，仏単語と英単語の対応関係を意味する． IBM翻訳モデルでは，英単語は1:nの対応を持ち，仏単語は1:1の対応を持つと仮定する．また，仏単語に適切な対応関係を持つ英単語が存在しないときには，その仏単語と英語文の先頭の特殊文字を対応させる．

平成25年2月13日