音響クラスタリング法におけるHTKの実験環境を表10に示す.
基本周波数 | 16kHz | |
分析窓 | Hamming窓 | |
分析窓長 | 25ms | |
フレーム周期 | 10ms | |
音響モデル | 3ループ4状態・半連続分布型 | |
stream数 | 3 | |
共分散行列 | Diagonal-covariance | |
MFCC | 12次MFCC+Δ12次MFCC+ | |
特徴ベクトル | 対数パワー+Δ対数パワー(計26次) | |
学習データ | ATR単語発話データベースASET5,240単語 | |
学習データの話者 | 女性話者1名(fyn) |
また音響クラスタリング法において生成するクラスタの数は1,000とする.