次へ: GIZA++
上へ: 単語対応の獲得
戻る: 単語対応の獲得
目次
IBMモデル
SMTにおける単語対応を得るための代表的なモデルとして,IBMモデルがある.
IBMモデルはmodel1からmodel5までの5つのモデルからなる.
IBMモデルでは原言語の日本語文
,目的言語の英語文
の翻訳モデル
を計算するため,アライメント
を用いる.以下にIBMモデルの基本的な計算式を示す.
|
|
|
(3.1) |
ここで,アライメント
は,日本語単語
と英単語
の対応関係を意味している.IBMモデルにおいて,各日本語単語に対応する英単語は1つであるのに対して,各英単語に対応する日本語単語は0からn個あると仮定する.また,日本語単語と適切な英単語が対応しない場合,英語文の先頭に
という空単語があると仮定し,日本語単語を対応させる.
平成25年2月13日