次へ: GIZA++
上へ: 単語に基づく統計翻訳
戻る: 単語に基づく統計翻訳の概要
目次
単語に基づく統計翻訳には,IBM社のBrownら[7]によって提案されたIBM翻訳モデルが用いられる.
IBM翻訳モデルは,Model1からModel5までの5つから構成され,順に複雑な計算を行う.
仏英翻訳で使用することを想定しているため,本節では,仏英翻訳を前提に説明を行う.
IBM翻訳モデルでは,フランス語文
と英語文
の翻訳モデル
を計算するために,アライメント
を用いる.
IBM翻訳モデルの基本式を以下に示す.
アライメント
は,仏単語
と英単語
の対応関係を意味する.
IBM翻訳モデルでは,英単語は1:nの対応を持ち,仏単語は1:1の対応を持つと仮定する.
また,仏単語に適切な対応関係を持つ英単語が存在しないときには,
その仏単語と英語文の先頭の特殊文字
を対応させる.
平成25年2月13日