next up previous contents
次へ: MFCC 上へ: HTKを用いた音節素片のモデル作成 戻る: HTKの特徴パラメータ   目次

FBANK

FBANKは音声波形をフーリエ変換して得られたパワースペクトラムの周波数を使 用する.パワースペクトラムを少ない次数で効率的に表現するために,メル分割さ れたフィルタバンクの対数パワーを使用する.またパワーケプストラムの全域に, 人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べる ためメルスケールに沿って等間隔に配置された三角関数のフィルタをかける.こ の三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメー タにおける次数)を表している.周波数メル分割の式を(1)に示す.

$\displaystyle Mel(f) = 2592 \log_{10} ( 1 + \frac{f}{700} )$ (1)

最終的に,フィルタバンクの出力にlog対数をとったものをFBANKとして使用する.



平成21年3月6日