母音は子音に比べ学習データ量が多い.しかし,母音は母音全てに話者適応HMM を用いた場合のみ認識精度が向上している.これに対し子音は,学習データ量の 多い音素があれば,1つの子音のみ話者適応HMMを使用した場合でも認識精度が向 上している.このことから,母音は子音に比べ認識精度の改善が難しいといえる.
本研究では,学習データは164単語,82単語と十分な量の学習データを用いてい る.しかし,学習データ量を減らした場合,母音全てに十分な音素数が含まれる とは限らない.このような場合,母音と子音で学習方法を変える,子音のみを用 いて混合HMMを作成するなどの対策が必要と考えている.