次へ: MFCC
上へ: 音響分析
戻る: 音響分析
目次
音声認識を行うためには,まず,音声区間の検出を行うことが必要である.そして尤
度 を計算するには, 音声区間の時系列データの表現形式を決める必
要がある.
音声波形そのものを用いたのでは情報量が多すぎ,波形の位相情報は伝送系や録音系
によって変わりやすい上,人間による音声の知覚にはほとんど寄与しないので,位相
情報はむしろ取り除いたほうがよい.このため,音声波から一定周期ごとに,短時間
スペクトル(密度) を抽出して用いることが多い.現在短時間スペクトル分析の手法と
しては,帯域フィルタ群を用いる方法,FFTを用いて直接的にスペクトルを計算する
方法,相関関数を用いる方法,およびLPC分析を基礎とする方法の4種類にわけ
ることができる[6].
平成20年3月11日