next up previous contents
Next: モデル1 Up: 単語に基づく統計翻訳 2.2 Previous: 概要   目次

IBM翻訳モデル

統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデル [3]がある.IMB翻訳モデルは,単語に基づく統計翻訳を想定して作成された,単語対応の確率モデルである.この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される.IBM翻訳モデルでは,フランス語から英語への翻訳を想定しているため,以下の説明では仏英翻訳を前提とする.本章では.原言語であるフランス語文を$F$,目的言語である英語文を$E$として定義する.

IBMモデルでは,フランス語文$E$,英語文$F$の翻訳モデル$P(F\vert E)$を計算するために,アライメント$a$を用いる.以下にIBMモデルの基本式を示す.

$\displaystyle P(F\vert E) = \sum_{a}P(F,a\vert E)$     (2.1)

アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメントでは,各仏単語\(f\)に対応する英単語\(e\)は1つあり,各英単語\(e\)に対応する仏単語は0から



Subsections

2018-03-06