次へ: HMMによる単語音声認識
上へ: honron
戻る: まえがき
  目次
研究目的
現在の音声認識では、特徴パラメータとしてケプストラム、メルケプストラムな
どが使われている。音声にはこのほかにもピッチ情報があるが、これを正確に抽
出する方法は、次の理由により、確立していない。
- 語頭や語尾において、声帯振動が完全な周期性をもたない。
- 音声波(スペクトル)中の声道特性と声帯音源信号を正確に分離するの
が難しい。
- 基本周波数の変化範囲が広い。
- ピッチ周波数の検出を行う際、処理方法に関わらず1/2ピッチや倍ピッ
チが抽出される
正確なピッチを抽出するのは困難であり、
また、基本的に無声子音において音声中にはピッチは存在し
ないために、ピッチ情報は
通常、音声認識に使用されていない。
しかし、最近の研究で、モーラ情報とピッチ情報の間に依存関係が
存在することわかった[1]。
この依存関係を使うことで、音声合成[1]や音素ラベリング
[8]の研究において精度の向上が確認されている。
そこで、この依存関係に着目し、モーラ情報を使用して音素
HMMを学習し単語音声認識を行うことで、
従来使用されなかったピッチ情報を利用できると考えられ、
単語音声認識の認識率は向上すると推定される。
よって、本研究ではモーラ情報を用いた単語音声認識の研究を行った。
平成14年4月24日