ただし,
は分類と文脈の集合を意味し,
は 文脈
に素性
があってなおかつ分類が
の場合 1 となり
それ以外で 0 となる関数を意味する.
また,
は,既知データでの
の出現の割合を意味する.
式(4.7)は確率
と
出力と素性の組の出現を意味する関数
をかけることで
出力と素性の組の頻度の期待値を求めることになっており,
右辺の既知データにおける期待値と,
左辺の求める確率分布に基づいて計算される
期待値が等しいことを制約として,
エントロピー最大化(確率分布の平滑化)を行って,
出力と文脈の確率分布を求めるものとなっている.