IBM翻訳モデル

IBM翻訳モデルを以下に示す.これは,力久ら[5]の抜粋である.統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデルがある.IMB翻訳モデルは,単語に基づく統計翻訳を想定して作成された,単語対応の確率モデルである.この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される.

本章では.原言語であるフランス語文を4#4,目的言語である英語文を5#5として定義する.

IBMモデルでは,フランス語文5#5,英語文4#4の翻訳モデル6#6を計算する ために,アライメント7#7を用いる.以下にIBMモデルの基本式を示す.

8#8     (2.1)

アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメ ントでは,各仏単語9#9に対応する英単語10#10は1つあり,各英単語10#10に対 応する仏単語は0からn個ある.また仏単語9#9において適切な英単語と 対応しない場合,英語文の先頭に空単語11#11があると仮定し,その仏単語 9#9と空単語11#11を対応づける.



Subsections