next up previous contents
次へ: 実験結果 上へ: 評価実験 戻る: 学習データと評価データ   目次

実験条件

本実験では認識にHTK[6]を使用し,実験環境は表1にまとめる. HMMの共分散行列にはDiagonal-covarience及び,Full-covariance(以下,Diagonal, Full)の2種類を使用する.stream数は3に設定し,FBANK,ΔFBANK,対数パワー とΔ対数パワーをそれぞれ多次元ガウス分布で表現する.
Fullの実験でのパラメータの再推定において,データ不足により作成できない音 素HMMが存在した場合,混合分布数がFBANK 2,ΔFBANK 2,対数パワー,Δ対数 パワー 1で作成できない音素はFBANK 1,ΔFBANK 1,対数パワー,Δ対数 パワー 1にする.この条件にしても作成できない音素HMMは実験には使用しない.


表 1: 実験条件
基本周波数 16kHz
分析窓 Hamming窓
分析窓長 25ms
フレーム周期 10ms
音響モデル 3ループ4状態・半連続分布型
stream数 3
FBANK 24次FBANK+Δ24次FBANK+
特徴ベクトル 対数パワー+Δ対数パワー(計50次)

Diagonal-covariance

連続型HMMの 母音・撥音・無音
初期モデルの FBANK 10 ΔFBANK 10
混合分布数 対数パワー,Δ対数パワー 4
連続型HMMの その他の音素
初期モデルの FBANK 4 ΔFBANK 4
混合分布数 対数パワー,Δ対数パワー 2
半連続型HMMの FBANK 256 ΔFBANK 256
混合分布数 対数パワー,Δ対数パワー 16

Full-covariance

連続型HMMの 母音・撥音・無音
初期モデルの FBANK 4 ΔFBANK 4
混合分布数 対数パワー,Δ対数パワー 2
連続型HMMの その他の音素
初期モデルの FBANK 2 ΔFBANK 2
混合分布数 対数パワー,Δ対数パワー 1
半連続型HMMの FBANK 128 ΔFBANK 128
混合分布数 対数パワー,Δ対数パワー 8


next up previous contents
次へ: 実験結果 上へ: 評価実験 戻る: 学習データと評価データ   目次
平成18年3月20日