IBM翻訳モデル

IBM翻訳モデルを以下に示す.本節は力久ら[5]の抜粋である.統計翻訳の代表的なモデルとして, IBMのBrownらによる仏英翻訳モデルがある.IMB翻訳モデルは, 単語に基づく統計翻訳を想定して作成された, 単語対応の確率モデルである.この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される.また本研究ではモデル1を用いた.

本章では.原言語であるフランス語文を1#1, 目的言語である英語文を2#2として定義する.

IBMモデルでは, フランス語文2#2, 英語文1#1の翻訳モデル3#3を計算する ために, アライメント4#4を用いる.以下にIBMモデルの基本式を示す.

5#5     (1)

アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメ ントでは, 各仏単語6#6に対応する英単語7#7は1つあり, 各英単語7#7に対 応する仏単語は0からn個ある.また仏単語6#6において適切な英単語と 対応しない場合, 英語文の先頭に空単語8#8があると仮定し, その仏単語 6#6と空単語8#8を対応づける.



Subsections