IBM翻訳モデル

次へ: GIZA++ 上へ: 翻訳モデル 戻る: 翻訳モデル目次

IBM翻訳モデル

IBM翻訳モデルは, 単語に基づく統計翻訳を想定して作成された単語対応の確率モデルである. IBM翻訳モデルは, 英語文 13#13 , 日本語文 3#3 の翻訳モデル 10#10 を計算するためにアラインメント 14#14 と呼ばれる概念を導入した. 以下にIBM翻訳モデルの基本式を示す. なお, アラインメントとは, ある日本語単語 3#3 と英単語 13#13 の対応関係のことを示す.

15#15

6#6

16#16

IBM翻訳モデルでは, 日英統計翻訳の場合, 英単語は１対17#17 の対応を持ち, 日本語の単語は１つの英単語のみと対応すると仮定する. また, 日本語の単語の対応関係として適切な英単語がなかった場合, 英語文の文頭の特殊文字13#13と対応付けを行う.

平成27年3月19日