next up previous contents
次へ: 単語音声認識精度 上へ: 同音異義語の認識精度 戻る: 特定話者実験の半連続型HMM   目次

特定話者実験の状態共有型HMM

特定話者における状態共有型HMMを用いたMFCC,Diagonalの同音異義語の認識精度 を表37に示す. またFBANK,Diagonalの同音異義語の認 識精度を表38に示す. なお, 状態数を制御する閾値が 一定であるために, 状態数は各実験条件とモデルによって異なる. 状態数以外の 実験条件は, 本研究での実験条件と同一である. MFCCでの状態数を表 35に, FBANK での状態数を表 36に示す.


表 35: 特定話者のモデルにおけるMFCCの状態数
モーラ アクセント triphone モーラ アクセント  
モデル モデル モデル triphoneモデル triphoneモデル  
約150 約200 約400 約425 約450  


表 36: 特定話者のモデルにおけるFBANKの状態数
モーラ アクセント triphone モーラ アクセント  
モデル モデル モデル triphoneモデル triphoneモデル  
約200 約300 約650 約675 約700  


表 37: 特定話者における状態共有型HMM,MFCC,Diagonalの同音異義語誤 り率
  アクセントモデル アクセントtriphoneモデル
mau 14%(3/22) 9%(2/22)
mmy 14%(3/22) 5%(1/22)
mnm 9%(2/22) 14%(3/22)
faf 9%(2/22) 5%(1/22)
fms 9%(2/22) 9%(2/22)
ftk 0%(0/22) 5%(1/22)
平均 9%(12/132) 8%(10/132)


表 38: 特定話者における状態共有型HMM,FBANK,Diagonalの同音異義語 誤り率
  アクセントモデル アクセントtriphoneモデル
mau 9%(2/22) 0%(0/22)
mmy 5%(3/22) 5%(1/22)
mnm 9%(2/22) 9%(2/22)
faf 5%(1/22) 5%(1/22)
fms 0%(0/22) 0%(0/22)
ftk 5%(1/22) 0%(0/22)
平均 7%(9/132) 3%(4/132)


next up previous contents
次へ: 単語音声認識精度 上へ: 同音異義語の認識精度 戻る: 特定話者実験の半連続型HMM   目次
平成18年3月20日