next up previous contents
次へ: FBANK 上へ: 音響分析 戻る: ケプストラム分析   目次

MFCC

ケプストラムパラメータには, 多様な計算方法がある. その中には MFCC(メル周波数ケプストラム係数)がある. MFCCは,まず音声周波数に対してFFTスペクトルを求め,メルスケール上に等間隔に配置 された帯域フィルタバンクの出力を抽出する. そして,最終的に離散コサイン 変換し得られるケプストラム係数がMFCCである.

高次においてピッチ成分,低次においてフォルマント成分が見られ,通常は扱いや すさの観点から低次のフォルマント成分が使用される.これは,言い換えれば声道 特性のみを用いていることになる.


\begin{displaymath}
c_i = \sqrt{ \frac{2}{N} } \sum_{j=1}^N m_j \cos ( \frac{\pi i}{N} ( j - 0.5 ) )
\end{displaymath} (10)

$ N $はフィルタバンクチャンネの数を表し,$ m_j $ は対数フィルタバンクの振 幅を表す.

本研究ではMFCC12次+対数パワーの形で用いる.



平成19年5月7日