現在の単語音声認識では、特徴パラメータとしてケプストラムやメルケプストラム などが使用されている。音声情報には、このほかにもピッチ情報があるが、安定し たピッチ周波数は、抽出が難しく通常使用されていない。
ところで、最近の研究でピッチ周波数とモーラ情報(モーラ位置・モーラ数)の間に 依存関係が存在することが知られている。この依存関係を使用することにより、 音声合成[1]や音素ラベリング[2]の研究において 、その品質や精度が向上し有効であることが確認されている。 この依存関係に着目しモーラ情報を使用して単語音声認識を 行った場合にも 単語音声認識の精度は向上すると推定できる。
そこで、本研究では、単語の母音、撥音を単語のモーラ数およびモーラ位置で分類して 音素HMMの学習を行い、この音素HMMを使用して単語音声認識を行う。 このときの認識の精度を検討し、モーラ情報の有効性を確認する。