next up previous contents
次へ: モデル1 上へ: 翻訳モデル 戻る: 翻訳モデルの概要   目次

IBM翻訳モデル

統計翻訳の翻訳モデルとして代表的なものに,Brownらが提案したIBMの仏英翻訳 モデル[5]がある.この翻訳モデルは提案者であるBrownらが全員IBMの社 員であったため,IBM翻訳モデルと呼ばれている.この翻訳モデルは順に複雑な 計算を行うモデル1からモデル5の5つのモデルから成る.IBM翻訳モデルではフ ランス語から英語への翻訳を想定しているため,フランス語文を\(F\),英語文 を\(E\)として説明を行う.

IBMモデルでは英語文\(E\)とフランス語文\(F\)の翻訳モデル\(P(F\vert E)\)を計算 するために,アライメント\(a\)を用いる.以下にIBMモデルの基本的な計算式を 示す.

$\displaystyle P(F\vert E) = \sum_a P(F, a\vert E)$     (3.3)

アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメ ントでは,各仏単語\(f\)に対応する英単語\(e\)は1つあり,各英単語\(e\)に対応す る仏単語は0からn個ある. また仏単語\(f\)において適切な英単語と対応しない場合,英語文の先頭に 空単語\(e_0\)があると仮定し,その仏単語\(f\)と空単語\(e_0\)を対応づける. 図3.2にアライメントの例を示す.

図 3.2: アライメントの例
\fbox{
\includegraphics{alignment.eps}
}



Subsections

平成22年2月11日