IBM翻訳モデル

Next: ・モデル1 Up: 統計翻訳 Previous: 単語に基づく統計翻訳目次

統計翻訳の代表的なモデルとして，IBMのBrownらによる仏英翻訳モデル []がある．IMB翻訳モデルは，単語に基づく統計翻訳を想定して作成された，単語対応の確率モデルである．この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される．

本章では．原言語であるフランス語文を，目的言語である英語文をとして定義する．

IBMモデルでは，フランス語文，英語文の翻訳モデル $P(F\vert E)$ を計算するために，アライメントを用いる．以下にIBMモデルの基本式を示す．

$\displaystyle P(F\vert E) = \sum_{a}P(F,a\vert E)$

(2.1)

アライメントとは仏単語と英単語の対応を意味している．IBMモデルのアライメントでは，各仏単語

に対応する英単語

は1つあり，各英単語

に対応する仏単語は0からn個ある．また仏単語

において適切な英単語と対応しない場合，英語文の先頭に空単語

があると仮定し，その仏単語

と空単語

を対応づける．

2015-03-21