next up previous contents
次へ: 目次 上へ: syuuron 戻る: syuuron   目次

概要

話者適応は,学習データ量が少ない場合認識精度が向上するとは限らない.また, 話者適応に用いる学習データ内に含まれる音素数が,認識精度に与える 影響についてはあまり考察されていない. そこで本研究は,学習データに含ま れる音素数に着目し,認識精度の低下を防ぐための手法として「混合HMM」を提案す る.

不特定話者の誤り率が11.17%であるのに対して,164単語の学習データを用いた 実験では, 話者適応の誤り率が13.48%,30個未満混合HMMの誤り率が8.84%となった.82単 語の学習 データを用いた実験では,話者適応の誤り率が33.08%,30個未満混合HMMの誤り 率が10.74%となり,混合HMMの有効性が得られた.

また,話者適応HMMと混合HMMの認識精度より,音素数に偏りを持つ学習データを 作成した. 164単語の音素数に偏りを持つ学習データを用いた実験では,話者適応の誤り率が 9.14%,30個未満混合HMMの誤り率が8.52%となった. 82単語の音素数に偏りを持つ学習データを用いた実験では,話者適応の誤り率が, 13.47%,30個未満混合HMMの誤り率が9.84%となり,通常の学習データより認識 精度が向上することを確認した.



平成20年3月11日