基本周波数 | 16kHz |
分析窓 | Hamming窓 |
分析窓長 | 25ms |
フレーム周期 | 10ms |
音響モデル | 3ループ4状態 |
半連続分布型 | |
stream数 | 3 |
MFCC | 12次MFCC+Δ12次MFCC |
特徴ベクトル | +対数パワー+Δ対数パワー |
(計26次) | |
FBANK | 24次FBANK+Δ24次FBANK |
特徴ベクトル | +対数パワー+Δ対5数パワー |
(計50次) | |
半連続型HMM | MFCC 1024 ΔMFCC 1024 |
Diagonal混合分布数 | 対数パワー,Δ対数パワー 64 |
半連続型HMM | MFCC 128 ΔMFCC 128 |
Full混合分布数 | 対数パワー,Δ対数パワー 16 |
状態共有型HMM | MFCC 4 ΔMFCC 4 |
Diagonal混合分布数 | 対数パワー,Δ対数パワー 2 |
FBANK の混合分布数はMFCCと同様なので省略 | |
半連続型HMM | Diagonal | MFCC 4 ΔMFCC 4 対数パワー,Δ対数パワー2 |
FBANK 4 ΔFBANK 4 対数パワー,Δ対数パワー2 | ||
Full | MFCC 1 ΔMFCC 1 対数パワー,Δ対数パワー1 | |
FBANK 1 ΔFBANK 1 対数パワー,Δ対数パワー1 | ||
状態共有型HMM | Diagonal | MFCC 1 ΔMFCC 1 対数パワー,Δ対数パワー1 |
FBANK 1 ΔFBANK 1 対数パワー,Δ対数パワー1 |