next up previous contents
次へ: MFCC 上へ: 特徴パラメータ 戻る: 特徴パラメータ   目次

FBANK

FBANK(フィルタバンク対数パワー)は音声周波数に対してFFTスペクトルを求め,メルスケールに沿って等間隔 に配置された三角関数のフィルタをかける. この三角関数の個数が,フィルタバンクのチャンネルのチャンネル数(特徴パラメータにおける次数)を表している.周波数メル分割の式を式(7)に示す.

$\displaystyle Mel(f) = 2592 \log_{10} ( 1 + \frac{f}{700} )$ (7)

そして,フィルタバンクの出力に log 対数パワーを求めたものがFBANKであり, 特徴パラメータにフォルマント成分及びピッチ成分が含まれる.これにより,音 声の特徴をより正確に表現できる[7].



平成24年3月20日