Full-covarianceの実験でのパラメータの再推定において,データ不足により作成できない音素HMMが存在する場合,混合分布数がMFCC 4,ΔMFCC 4,対数パワー,Δ対数パワー 2で作成できない音素HMMはMFCC 2,ΔMFCC 2,対数パワー,Δ対数パワー 2にする.混合分布数がMFCC 2,ΔMFCC 2,対数パワー,Δ対数パワー 2で作成できない音素HMMはMFCC 1,ΔMFCC 1,対数パワー,Δ対数パワー 1にする.混合数をMFCC 1,ΔMFCC 1,対数パワー,Δ対数パワー 1にしても作成できない音素HMMは実験には用いない.FBANKも同様にして作成できない音素の混合分布数を減らしていく.
基本周波数 | 16kHz |
分析窓 | Hamming窓 |
分析窓長 | 25ms |
フレーム周期 | 10ms |
音響モデル | 3ループ4状態 |
半連続分布型 | |
stream数 | 3 |
MFCC | |
特徴パラメータ | MFCC(12次)+ΔMFCC(12次) |
+対数パワー+Δ対数パワー (計26次) | |
連続型HMMの | (母音・撥音・無音)MFCC 4,ΔMFCC 4 |
初期モデルの | ,対数パワー,Δ対数パワー 2 |
混合分布数 | |
(その他の音素)MFCC 2,ΔMFCC 2,対数パワー,Δ対数パワー 2 | |
半連続型HMMの | MFCC 128,ΔMFCC 128,対数パワー,Δ対数パワー 16 |
混合分布数 | |
FBANK | |
特徴パラメータ | FBANK(24次)+ΔFBANK(24次) |
+対数パワー+Δ対数パワー (計50次) | |
連続型HMMの | (母音・撥音・無音)FBANK 4,ΔFBANK 4 |
初期モデルの | ,対数パワー,Δ対数パワー 2 |
混合分布数 | |
(その他の音素)FBANK 2,ΔFBANK 2,対数パワー,Δ対数パワー 2 | |
半連続型HMMの | FBANK 128,ΔFBANK 128,対数パワー,Δ対数パワー 16 |
混合分布数 |