next up previous contents
次へ: モデル1 上へ: 翻訳モデル 戻る: 翻訳モデル   目次

IBMモデル

統計翻訳における単語対応を得るための代表的なモデルとして,IBM翻訳モデル[4]がある. IBM翻訳モデルは仏英翻訳を前提としている.しかし,本研究は日英翻訳を扱うため,原言語文を日本語文$ J$ ,目的言語文を英語文$ E$ と定義する.

IBM翻訳モデルにおいて,日本語文$ J$ と英語文$ E$ の翻訳モデル$ P(J\vert E)$ を計算するため,アライメント$ a$ と呼ばれる概念を導入する.アライメントはある日本語単語$ j$ と英単語$ e$ の対応関係を意味する.IBMモデルの基本的な計算式を式(2.2)に示す.

$\displaystyle P(J\vert E) = \sum P(J,a\vert E)$ (2.2)

IBM翻訳モデルにおいて,各日本語単語に対応する英単語は1つであるのに対し,各英単語に対応する日本語単語は0から$ n$ 個あると仮定する.また,日本語単語に対応する適切な英語単語がない場合,英語文の先頭に特殊文字$ e_{0}$ があると仮定し,日本語単語と対応させる.



平成27年3月13日