評価実験は,男性話者3名と女性話者3名で行う.実験には単語音声認識ツール のHTK [4] を使用する.本研究では,韻律的情報が含まれているFBANK と,一般に用いられているMFCC を音響パラメータとして使用する.HMMの共分 散行列は,Diagonal covarianceで行う.MFCCとFBANKは,共に同じ混合ガウス 分布数を利用する.本研究で用いる音響パラメータはHTKのdefault値を利用す る.またHMMの実験条件を表3にまとめる.
音響モデル | 3ループ4状態 |
半連続分布型 | |
stream数 | 3 |
混合ガウス分布数 | MFCC 1024 + MFCC 1024 |
(Diagonal) | + 対数パワー 64 + 対数パワー 64 |
混合ガウス分布数 | MFCC 128 + MFCC 128 |
(Full) | 対数パワー 16 + 対数パワー 16 |