IBMモデル

次へ: モデル1 上へ: 翻訳モデル 戻る: 翻訳モデル目次

統計翻訳における単語対応を得るための代表的なモデルとして，IBM翻訳モデル[4]がある． IBM翻訳モデルは仏英翻訳を前提としている．しかし，本研究は日英翻訳を扱うため，原言語文を日本語文

，目的言語文を英語文

と定義する．

IBM翻訳モデルにおいて，日本語文と英語文の翻訳モデル $P(J\vert E)$ を計算するため，アライメントと呼ばれる概念を導入する．アライメントはある日本語単語と英単語の対応関係を意味する．IBMモデルの基本的な計算式を式(2.2)に示す．

$\displaystyle P(J\vert E) = \sum P(J,a\vert E)$

(2.2)

IBM翻訳モデルにおいて，各日本語単語に対応する英単語は1つであるのに対し，各英単語に対応する日本語単語は0から個あると仮定する．また，日本語単語に対応する適切な英語単語がない場合，英語文の先頭に特殊文字 $e_{0}$ があると仮定し，日本語単語と対応させる．

平成27年3月13日