評価実験は,男性話者3名と女性話者3名で行う.実験には音声認識ツールのHTK [7]を使用する.HMMの共分散行列にはDiagonal-covarianceを使用する. その他の実験条件は表1に示す. 実験条件は話者ごとに統一している.特徴量のベクトル数は同一にするのが困難 であるため同じではない.
基本周波数 | 16kHz |
フレームの長さ | 20ms |
シフト幅 | 10ms |
音響モデル | 状態数3 |
混合数 話者に依存 | |
特徴量 | MFCC(14次元) |
(特徴ベクトル数) | LFCC(64次元) |
パワースペクトル(FFTpower)(256次元) | |
提案特徴量(FFT_Real_Img)(256+256次元) | |
FFTpower+FFT_Real_Img(二手法併用)(256+256+256次元) | |
共分散行列 | Diagonal-covariance |