next up previous contents
次へ: 実験結果 上へ: 評価実験 戻る: 学習データと評価データ   目次

実験条件

評価実験は, 男性話者3名と女性話者3名で行う. 実験には単語音声認識ツールの HTK [7] を使用する. その他の実験条件を表12に示す . HTKの設定ファイルは付録に示す. なお, 状態共有型HMMにおいて, 半連続型 HMMのDiagonalの実験条件と同一にするために, 混合分布数は $2112(1024+1024+64)$とする. stream数は3に設定し,MFCCを用いた実験では MFCC, ΔMFCC, 対数パワーとΔ対数パワーを, FBANKを用いた実験ではFBANK, Δ FBANK, 対数パワーとΔ対数パワーをそれぞれ別の多次元ガウス分布で表現する . なお, MFCCとFBANKの特徴パラメータの次数は同じにするのが困難である. その ため, 特徴パラメータの次数は同一にしていない. また, 初期モデルの混合分布数 を表13に示す.




表 12: 実験条件
基本周波数 16kHz
分析窓 Hamming窓
分析窓長 25ms
フレーム周期 10ms
音響モデル 3ループ4状態
半連続分布型
stream数 3
MFCC 12次MFCC+Δ12次MFCC
特徴ベクトル +対数パワー+Δ対数パワー
(計26次)
FBANK 24次FBANK+Δ24次FBANK
特徴ベクトル +対数パワー+Δ対5数パワー
(計50次)
半連続型HMM MFCC 1024 ΔMFCC 1024
Diagonal混合分布数 対数パワー,Δ対数パワー 64
半連続型HMM MFCC 128 ΔMFCC 128
Full混合分布数 対数パワー,Δ対数パワー 16
状態共有型HMM MFCC 4 ΔMFCC 4
Diagonal混合分布数 対数パワー,Δ対数パワー 2
FBANK の混合分布数はMFCCと同様なので省略


表 13: 初期モデルの混合分布数
半連続型HMM Diagonal MFCC 4 ΔMFCC 4 対数パワー,Δ対数パワー2
FBANK 4 ΔFBANK 4 対数パワー,Δ対数パワー2
Full MFCC 1 ΔMFCC 1 対数パワー,Δ対数パワー1
FBANK 1 ΔFBANK 1 対数パワー,Δ対数パワー1
状態共有型HMM Diagonal MFCC 1 ΔMFCC 1 対数パワー,Δ対数パワー1
FBANK 1 ΔFBANK 1 対数パワー,Δ対数パワー1


next up previous contents
次へ: 実験結果 上へ: 評価実験 戻る: 学習データと評価データ   目次
平成18年3月20日