next up previous contents
次へ: MFCC 上へ: 特徴パラメータ 戻る: 特徴パラメータ   目次

FBANK

FBANK(フィルタバンク対数パワー)は音声周波数に対してFFTスペクトルを求め,メルスケールに沿って等間隔 に配置された三角関数のフィルタをかける. この三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメータにおける次数)を表している.周波数メル分割の式は

$\displaystyle Mel(f) = 2592 \log_{10} ( 1 + \frac{f}{700} )$ (7)

となる. そして,フィルタバンクの出力に log 対数パワーを求めたものがFBANKであり, 特徴パラメータにフォルマント成分及びピッチ成分が含まれる.これにより,音 声の特徴をより正確に表現できる[5].



平成20年5月16日