next up previous contents
次へ: HMMによる単語音声認識 上へ: honron 戻る: まえがき   目次


研究目的

現在の音声認識では、特徴パラメータとしてケプストラム、メルケプストラムな どが使われている。音声にはこのほかにもピッチ情報があるが、これを正確に抽 出する方法は、次の理由により、確立していない。 正確なピッチを抽出するのは困難であり、 また、基本的に無声子音において音声中にはピッチは存在し ないために、ピッチ情報は 通常、音声認識に使用されていない。

しかし、最近の研究で、モーラ情報とピッチ情報の間に依存関係が 存在することわかった[1]。 この依存関係を使うことで、音声合成[1]や音素ラベリング [8]の研究において精度の向上が確認されている。 そこで、この依存関係に着目し、モーラ情報を使用して音素 HMMを学習し単語音声認識を行うことで、 従来使用されなかったピッチ情報を利用できると考えられ、 単語音声認識の認識率は向上すると推定される。

よって、本研究ではモーラ情報を用いた単語音声認識の研究を行った。


平成14年4月24日