next up previous
次へ: アクセントモデルとアクセントtriphoneモデルの作成手順 上へ: 評価実験 戻る: 学習データと評価データ

分析条件

評価実験は,男性話者3名と女性話者3名で行う.実験には単語音声認識ツール のHTK [4] を使用する.本研究では,韻律的情報が含まれているFBANK と,一般に用いられているMFCC を音響パラメータとして使用する.HMMの共分 散行列は,Diagonal covarianceで行う.MFCCとFBANKは,共に同じ混合ガウス 分布数を利用する.本研究で用いる音響パラメータはHTKのdefault値を利用す る.またHMMの実験条件を表3にまとめる.


表: HMMのパラメータ
音響モデル 3ループ4状態
半連続分布型
stream数 3
混合ガウス分布数 MFCC 1024 + $ \Delta$ MFCC 1024
(Diagonal) + 対数パワー 64 + $ \Delta$ 対数パワー 64
混合ガウス分布数 MFCC 128 + $ \Delta$ MFCC 128
(Full) 対数パワー 16 + $ \Delta$ 対数パワー 16



Jin'ichi Murakami 平成21年10月7日