next up previous contents
次へ: MFCC 上へ: 音声分析 戻る: 音声の特徴量抽出   目次

ケプストラム分析

ケプストラム(cepstrum)は,波形のパワースペクトル $ \vert S(e^{j\omega}) \vert $ の対数の逆フーリエ変換として定義される. つまり,式9の出力を逆フーリェ変換すると,


\begin{displaymath}
c_n = \frac{1}{N} \sum_{k=0}^{N-1} log \vert S(k) \vert e^{j 2 \pi k n / N} (0 \le n \le N-1)
\end{displaymath} (10)

となる.この出力はLFCC(Linear Frequency Cepstrum Coefficient)という特徴 量になる. ケプストラムという言葉は,スペクトルを逆変換するという意味から,spectrumを もじって作った造語であり,その変数はfrequencyをもじってケフレンシー (quefrency)と呼ばれる. 従来の音声認識では,特徴パラメータとしてケプストラムが使われてきた.ケプス トラムは低次にフォルマント情報を高次にピッチ情報を含んでいる.しかしピッ チ情報は正確なピッチ周波数の抽出が困難であるため,音声認識ではフォルント 情報のみを使用する.



平成25年10月13日