特徴抽出

次へ: MFCC 上へ: 音響分析 戻る: 音響分析目次

特徴抽出

音声認識を行うためには，まず，音声区間の検出を行うことが必要である．そして尤度 $P(y\vert w)$ を計算するには, 音声区間の時系列データ

の表現形式を決める必要がある．音声波形そのものを用いたのでは情報量が多すぎ，波形の位相情報は伝送系や録音系によって変わりやすい上，人間による音声の知覚にはほとんど寄与しないので，位相情報はむしろ取り除いたほうがよい．このため，音声波から一定周期ごとに，短時間スペクトル(密度) を抽出して用いることが多い．現在短時間スペクトル分析の手法としては，帯域フィルタ群を用いる方法，FFTを用いて直接的にスペクトルを計算する方法，相関関数を用いる方法，およびLPC分析を基礎とする方法の4種類にわけることができる[6]．

平成20年3月11日