next up previous contents
次へ: MFCC 上へ: 音声分析 戻る: ケプストラム   目次

FBANK

FBANKは音声波形をフーリエ変換して得られたパワースペクトラムの周波数を使 用する. パワースペクトラムを少ない次数で効率的に表現するために,メル分割 されたフィルタバンクの対数パワーを使用する. またパワーケプストラムの全域 に,人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調 べるためメルスケールに沿って等間隔に配置された三角関数のフィルタをかける. この三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメー タにおける次数)を表している. 周波数メル分割の式は
\begin{displaymath}
Mel(f) = 2592 \log_{10}
( 1 + \frac{f}{700} )
\end{displaymath} (11)

となる. そして, フィルタバンクの出力にlog対数をとったものをFBANKとして使用する.



平成18年3月20日