next up previous contents
次へ: 謝辞 上へ: syuuron 戻る: 追加実験   目次

おわりに

本研究では学習データに含まれる各音素の数に注目し,話者適応HMMと不特定話 者HMMを組み合わせた混合HMMを提案し,不特定話者HMM,話者適応HMM,混合HMMを用い て単語音声認識を行い認識精度を調査した.

不特定話者の誤り率が11.17%であるのに対して,164単語の学習データを用いた 実験では,話者適応の誤り率が13.48%,30個未満混合HMMの誤り率が8.84%となっ た.82単語の学習データを用いた実験では,話者適応の誤り率が33.08%,30個 未満混合HMMの誤り率が10.74%となり,混合HMMの有効性が得られた.

また,混合HMMの実験結果を元に,あらかじめ音素数の少ない音素を削除し,音 素数の多い音素を 増やした学習データを作成することで更に認識精度が向上すると考え,音素数に 偏りを持つ学習データを作成した.

164単語の音素数に偏りを持つ学習データを用いた実験では,話者適応の誤り率が 9.14%,30個未満混合HMMの誤り率が8.52%となった. 82単語の音素数に偏りを持つ学習データを用いた実験では,話者適応の誤り率が, 13.47%,30個未満混合HMMの誤り率が9.84%となり,通常の学習データより認識 精度が向上することを確認した.

今後の課題として,単語数がより少ない学習データでの認識精度向上と, MLLRやMAP推定などの話者適応を用いた場合の認識精度の調査が挙げられる.



平成20年3月11日