基本周波数 | 16kHz | |
分析窓 | Hamming窓 | |
分析窓長 | 25ms | |
フレーム周期 | 10ms | |
音響モデル | 3ループ4状態・半連続分布型 | |
stream数 | 3 | |
FBANK | 24次FBANK+Δ24次FBANK+ | |
特徴ベクトル | 対数パワー+Δ対数パワー(計50次) | |
Diagonal-covariance |
||
連続型HMMの | 母音・撥音・無音 | |
初期モデルの | FBANK 10 ΔFBANK 10 | |
混合分布数 | 対数パワー,Δ対数パワー 4 | |
連続型HMMの | その他の音素 | |
初期モデルの | FBANK 4 ΔFBANK 4 | |
混合分布数 | 対数パワー,Δ対数パワー 2 | |
半連続型HMMの | FBANK 256 ΔFBANK 256 | |
混合分布数 | 対数パワー,Δ対数パワー 16 | |
Full-covariance |
||
連続型HMMの | 母音・撥音・無音 | |
初期モデルの | FBANK 4 ΔFBANK 4 | |
混合分布数 | 対数パワー,Δ対数パワー 2 | |
連続型HMMの | その他の音素 | |
初期モデルの | FBANK 2 ΔFBANK 2 | |
混合分布数 | 対数パワー,Δ対数パワー 1 | |
半連続型HMMの | FBANK 128 ΔFBANK 128 | |
混合分布数 | 対数パワー,Δ対数パワー 8 |