次へ: 質問
上へ: 木に基づく状態共有
戻る: 不特定話者における実験結果の比較
目次
特定話者の前後音素環境情報を用いた状態共有型HMMにおいて, 最も高い単語認識
精度が得られた. また, 同音異義語認識において, FBANK, Fullの半連続型HMMと
FBANKの状態共有型HMMの認識精度が最も高い. ただし, 各実験の条件は, 混合分布
数が異なっており同一ではない. また, FBANKのDiagonalではMFCCのDiagonalと比
較して単語認識精度が劣ることが知られている[5],[12]. し
かし, FBANK, Diagonalの状態共有型HMMの単語認識精度がMFCCの結果より高いのは
, FBANKでの状態数がMFCCより適切な値となっているためだと考えている.
平成18年3月20日