次へ: MFCC
上へ: 音声分析
戻る: ケプストラム
目次
FBANKは音声波形をフーリエ変換して得られたパワースペクトラムの周波数を使用する.パワースペクトラムを少ない次数で効率的に表現するために,メル分割されたフィルタバンクの対数パワーを使用する.またパワーケプストラムの全域に,人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べるためメルスケールに沿って等間隔に配置された三角関数のフィルタをかける.この三角関数の個数がフィルタバンクのチャンネルのチャンネル数(特徴パラメータにおける次数)を表している.周波数メル分割の式は
![\begin{displaymath}
Mel(f) = 2592 \log_{10}
( 1 + \frac{f}{700} )
\end{displaymath}](img26.png) |
(11) |
となる.そして,フィルタバンクの出力にlog対数をとったものをFBANKとして使用する.
平成16年4月17日