次へ: 謝辞 上へ: syuuron 戻る: 追加実験目次

おわりに

本研究では学習データに含まれる各音素の数に注目し，話者適応HMMと不特定話者HMMを組み合わせた混合HMMを提案し，不特定話者HMM，話者適応HMM，混合HMMを用いて単語音声認識を行い認識精度を調査した．

不特定話者の誤り率が11.17%であるのに対して，164単語の学習データを用いた実験では，話者適応の誤り率が13.48%，30個未満混合HMMの誤り率が8.84%となった．82単語の学習データを用いた実験では，話者適応の誤り率が33.08%，30個未満混合HMMの誤り率が10.74%となり，混合HMMの有効性が得られた．

また，混合HMMの実験結果を元に，あらかじめ音素数の少ない音素を削除し，音素数の多い音素を増やした学習データを作成することで更に認識精度が向上すると考え，音素数に偏りを持つ学習データを作成した．

164単語の音素数に偏りを持つ学習データを用いた実験では，話者適応の誤り率が 9.14%，30個未満混合HMMの誤り率が8.52%となった． 82単語の音素数に偏りを持つ学習データを用いた実験では，話者適応の誤り率が， 13.47%，30個未満混合HMMの誤り率が9.84%となり，通常の学習データより認識精度が向上することを確認した．

今後の課題として，単語数がより少ない学習データでの認識精度向上と， MLLRやMAP推定などの話者適応を用いた場合の認識精度の調査が挙げられる．

平成20年3月11日