next up previous contents
次へ: MFCC 上へ: 木に基づくクラスタリングの特徴パラメータ 戻る: 木に基づくクラスタリングの特徴パラメータ   目次

FBANK

FBANKは音声波形をフーリエ変換して得られたパワースペクトラムの周波数を使用する.パワースペクトラムを少ない次数で効率的に表現するために,メル分割されたフィルタバンクの対数パワーを使用する.またパワーケプストラムの全域に,人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べるためメルスケールに沿って等間隔に配置された三角関数のフィルタをかける.この三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメータにおける次数)を表している.周波数メル分割の式は

$\displaystyle Mel(f) = 2592 \log_{10} ( 1 + \frac{f}{700} )$ (5)

となる.そして,フィルタバンクの出力にlog対数をとったものをFBANKとして使用 する.



平成19年3月12日