next up previous contents
次へ: Model1 上へ: 翻訳モデル 戻る: 翻訳モデル   目次

IBM翻訳モデル

翻訳モデルの代表例として,Brownらが提案したIBM翻訳モデル[4]がある.IBM 翻訳モデルは,Model1からModel5まで5つのモデルからなり,順に複雑な計算となる. IBM翻訳モデルは本来,仏英翻訳を想定としているが,本研究では日英翻訳と英日翻訳を行うため,日英翻訳を想定して説明をする.

英語文 $E$ ,日本語文 $J$ の翻訳モデル $P(J\vert E)$ を計算するためにアラインメント $a$ を用いる.アライメントとは,日本語単語$J$と英単語$E$の対応を意味する.以下にIBMモデルの式を示す.


$\displaystyle P(J \mid E)$ $\textstyle =$ $\displaystyle \sum_{\it a} P(J,a \mid E)$ (2.3)

IBMモデルのアライメントでは,日英統計翻訳の場合,日本語単語$j$に対する英単語$e$は1つあり,各英単語$e$に対する日本語単語$j$は0から$n$個あると仮定する. また,日本語単語の対応関係として適切な英単語がなかった場合,英語文の文頭に空単語$e_0$があると仮定し,その日本語単語$j$と空単語$e_0$を対応させる.



Subsections

s102025 平成27年3月9日