IBM翻訳モデルにおいて,日本語文 と英語文 の翻訳モデル を計算するため,アライメント と呼ばれる概念を導入する.アライメントはある日本語単語 と英単語 の対応関係を意味する.IBMモデルの基本的な計算式を式(2.2)に示す.
IBM翻訳モデルにおいて,各日本語単語に対応する英単語は1つであるのに対し,各英単語に対応する日本語単語は0から 個あると仮定する.また,日本語単語に対応する適切な英語単語がない場合,英語文の先頭に特殊文字 があると仮定し,日本語単語と対応させる.