IBM翻訳モデル

次へ: モデル1 上へ: 翻訳モデル 戻る: 翻訳モデルの概要目次

IBM翻訳モデル

統計翻訳の翻訳モデルとして代表的なものに，Brownらが提案したIBMの仏英翻訳モデル[5]がある．この翻訳モデルは提案者であるBrownらが全員IBMの社員であったため，IBM翻訳モデルと呼ばれている．この翻訳モデルは順に複雑な計算を行うモデル1からモデル5の5つのモデルから成る．IBM翻訳モデルではフランス語から英語への翻訳を想定しているため，フランス語文を $F$ ，英語文を $E$ として説明を行う．

IBMモデルでは英語文 $E$ とフランス語文 $F$ の翻訳モデル $P(F\vert E)$ を計算するために，アライメント $a$ を用いる．以下にIBMモデルの基本的な計算式を示す．

$\displaystyle P(F\vert E) = \sum_a P(F, a\vert E)$

(3.3)

アライメントとは仏単語と英単語の対応を意味している．IBMモデルのアライメントでは，各仏単語 $f$ に対応する英単語 $e$ は1つあり，各英単語 $e$ に対応する仏単語は0からn個ある．また仏単語 $f$ において適切な英単語と対応しない場合，英語文の先頭に空単語 $e_0$ があると仮定し，その仏単語 $f$ と空単語 $e_0$ を対応づける．図3.2にアライメントの例を示す．

**図 3.2:** アライメントの例
$\fbox{ \includegraphics{alignment.eps} }$

Subsections

平成22年2月11日