next up previous contents
次へ: 謝辞 上へ: soturon 戻る: 単語音声認識に対する考察   目次

おわりに

本研究では,従来の単語音声認識において,あまり行われて来なかった同音異義語認識の研究を行った.同音異義語を音声認識するために,音素HMMに単語のアクセント型の情報と各モーラ位置でのアクセントの高低の情報を加えたアクセントモデルを提案し,単語音声認識実験を行った.そして,評価データ中に含まれるアクセントの異なる同音異義語に注目した.また,特徴パラメータに一般的に使われているMFCCは音韻的特徴しか含んでいないため,アクセントを用いた実験において認識精度が低いと予測され,韻律的特徴を含むFBANKを用いて実験を行った.

実験の結果,特徴パラメータにFBANKを用いたFull-covarianceの実験において,平均97%の同音異義語を認識できことにより,アクセントモデルの同音異義語に対する音声認識の有効性を確認した.また,アクセントモデルの単語音声認識精度は,通常の音素ラベルを用いて学習した音素HMMを用いた基本モデルに比べて高いこにより,アクセントモデルの単語音声認識に対する有効性を確認した.そして,FBANKを用いた特徴パラメータではMFCCに比べてアクセントモデルの同音異義語の認識精度が高いことにより,FBANKを用いた特徴パラメータの同音異義語認識に対する有効性を確認した.

本研究条件での同音異義語に対するこれ以上の改良は困難であると考えられるので,今後の課題としては,不特定話者認識や雑音環境におけるアクセントモデルの有効性について検証する必要があると考えられる.



平成16年4月17日