MFCC(メル周波数ケプストラム係数)は, まず音声周波数に対してFFTスペクトルを求め,メルスケール上に等間隔に配置 された帯域フィルタバンクの出力を抽出する. そして,最終的に離散コサイン 変換し得られるケプストラム係数がMFCCである.
高次においてピッチ成分, 低次においてフォルマント成分が見られ, 通常は扱いや すさの観点から低次のフォルマント成分が使用される. これは, 言い換えれば声道 特性のみを用いていることになる.