next up previous contents
Next: ・モデル1 Up: 統計翻訳 Previous: 単語に基づく統計翻訳   目次

IBM翻訳モデル

統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデル []がある.IMB翻訳モデルは,単語に基づく統計翻訳を想定して作成さ れた,単語対応の確率モデルである.この翻訳モデルは順に複雑な計算を行うモ デル1から5の5つのモデルで構成される.

本章では.原言語であるフランス語文を$ F$ ,目的言語である英語文を$ E$ として定義する.

IBMモデルでは,フランス語文$ E$ ,英語文$ F$ の翻訳モデル$ P(F\vert E)$ を計算する ために,アライメント$ a$ を用いる.以下にIBMモデルの基本式を示す.

$\displaystyle P(F\vert E) = \sum_{a}P(F,a\vert E)$     (2.1)

アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメ ントでは,各仏単語$ f$ に対応する英単語$ e$ は1つあり,各英単語$ e$ に対 応する仏単語は0からn個ある.また仏単語$ f$ において適切な英単語と 対応しない場合,英語文の先頭に空単語$ e_0$ があると仮定し,その仏単語 $ f$ と空単語$ e_0$ を対応づける.



Subsections

2015-03-21