ただし, は分類と文脈の集合を意味し, は 文脈 に素性 があってなおかつ分類が の場合 1 となり それ以外で 0 となる関数を意味する. また, は,既知データでの の出現の割合を意味する.
式(4.7)は確率 と 出力と素性の組の出現を意味する関数 をかけることで 出力と素性の組の頻度の期待値を求めることになっており, 右辺の既知データにおける期待値と, 左辺の求める確率分布に基づいて計算される 期待値が等しいことを制約として, エントロピー最大化(確率分布の平滑化)を行って, 出力と文脈の確率分布を求めるものとなっている.