next up previous contents
次へ: Model1 上へ: 翻訳モデル 戻る: 翻訳モデルの概要   目次

IBM翻訳モデル

統計翻訳で代表的なモデルとして,Brownらが提案したフランス語英語翻訳モデルがある.この翻訳モデルは,提案したBrownら全員がIBMの社員であったため,通称IBM翻訳モデル(IBM Model)といわれる.IBM翻訳モデルは,Model1からModel5まで5つのモデルからなり,順に複雑な計算となる.第2.3.2章の説明では,翻訳する言語をフランス語\(f\),目的言語を英語\(e\)と想定して行う.

IBM翻訳モデルでは,フランス語文\(f\)と英語文\(e\)の翻訳モデル$P(f\vert e)$を計算するために,アライメント$\alpha$を用いる.(2.3)にIBM翻訳モデルの基本的な計算式を示す.


$\displaystyle P(f\vert e)=\sum_{a}P(f,a\vert e)$     (2.3)

アライメント$\alpha$はフランス単語\(f\)と英単語\(e\)における対応関係を示す.IBM翻訳モデルにおけるアライメントは,フランス語側の各単語\(f\)において,それぞれ英語側に対応する単語\(e\)が一つある.また,英語側の各単語\(e\)は,フランス語側に対応する単語\(f\)が0〜\(n\)個ある.また,フランス単語\(f\)において,適切な英単語\(e\)との対応関係がなかった場合,英語文の先頭に$e_{0}$という空単語があると仮定し,そのフランス語と空単語$e_{0}$を対応づける.フランス語英語翻訳におけるアライメントの例を図2.2に示す.

図: アライメントの例
\fbox{
\includegraphics*[clip,width=10cm]{align.eps}
}

$\alpha$ $\alpha_{1}^{n}=\alpha_{1},\alpha{2},...,\alpha_{n}$である.また,$\alpha_{1}$は,$f_{1}$の単語Leと$e_{a_{1}=1}$の単語Theにおける対応関係を表す.


平成28年3月16日