IBM翻訳モデル

次へ: モデル1 上へ: 単語に基づく統計翻訳 戻る: 単語に基づく統計翻訳目次

IBM翻訳モデル

統計翻訳の代表的なモデルとして，IBMのBrownらによる仏英翻訳モデル [3]がある．IMB翻訳モデルは，単語に基づく統計翻訳を想定して作成された，単語対応の確率モデルである．この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される．IBM翻訳モデルでは，フランス語から英語への翻訳を想定しているため，以下の説明では仏英翻訳を前提とする．本章では．原言語であるフランス語文を

，目的言語である英語文を

として定義する．

IBMモデルでは，フランス語文，英語文の翻訳モデル $P(F\vert E)$ を計算するために，アライメントを用いる．以下にIBMモデルの基本式を示す．

$\displaystyle P(F\vert E) = \sum_{a}P(F,a\vert E)$

(3.1)

アライメントとは仏単語と英単語の対応を意味している．IBMモデルのアライメントでは，各仏単語 $f$ に対応する英単語 $e$ は1つあり，各英単語 $e$ に対応する仏単語は0からn個ある．また仏単語 $f$ において適切な英単語と対応しない場合，英語文の先頭に空単語 $e_0$ があると仮定し，その仏単語 $f$ と空単語 $e_0$ を対応づける．

Subsections

平成26年3月13日