FBANK(フィルタバンク対数パワー)は音声周波数に対してFFTスペクトルを求め,パワーケプストラムの全域に,人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べるためメルスケールに沿って等間隔
に配置された三角関数のフィルタをかける.
この三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメータにおける次数)を表している.周波数メル分割の式は
FBANKは混合ガウス分布にFull-covarianceを用いた場合にMFCCよりも認識率が高 いことが知られている[7].
本研究において,基本周波数16KHzの音に対してFBANK24次+対数パワーの形で 用いる.