next up previous contents
次へ: 特定話者実験の半連続型HMM 上へ: 同音異義語の認識精度 戻る: 同音異義語の認識精度   目次

状態数無調整の状態共有型HMM

状態数を調整していない状態共有型HMM, MFCCでの同音異義語認識精度を表 28に示す. また, FBANKでの同音異義語認識精度を表 29に示す. 状態数を制御する閾値が一定であるために, 状態数 は各実験条件とモデルによって異なる. 状態数以外の実験条件は, 本研究での実 験条件と同一である. MFCCでの状態数を表26に, FBANK での状態数を表27に示す.


表 26: モデルにおけるMFCCの状態数
モーラ アクセント triphone モーラ アクセント  
モデル モデル モデル triphoneモデル triphoneモデル  
約200 約300 約1000 約1050 約1100  


表 27: モデルにおけるFBANKの状態数
モーラ アクセント triphone モーラ アクセント  
モデル モデル モデル triphoneモデル triphoneモデル  
約300 約550 約1500 約1750 約1900  


表 28: MFCC,diagonal,状態数無調整の状態共有型HMMの同音異義語誤り率
  アクセントモデル アクセントtriphoneモデル
mau 41%(9/22) 18%(4/22)
mmy 45%(10/22) 14%(3/22)
mnm 32%(7/22) 23%(5/22)
faf 27%(6/22) 14%(3/22)
fms 14%(3/22) 18%(4/22)
ftk 32%(7/22) 27%(6/22)
平均 32%(42/132) 19%(25/132)


表 29: FBANK,diagonal,状態数無調整の状態共有型HMMの同音異義語誤り率
  アクセントモデル アクセントtriphoneモデル
mau 18%(4/22) 36%(8/22)
mmy 50%(11/22) 14%(3/22)
mnm 36%(8/22) 27%(6/22)
faf 27%(6/22) 14%(3/22)
fms 23%(5/22) 0%(0/22)
ftk 14%(3/22) 14%(3/22)
平均 28%(37/132) 17%(23/132)

実験より以下の結果を得た.

  1. 得られた精度は, 同条件の半連続型HMMのDiagonalと状態数を調整した状 態共有型HMMの精度より高い. しかし, 半連続型HMMのFullよりは高くな い.


next up previous contents
次へ: 特定話者実験の半連続型HMM 上へ: 同音異義語の認識精度 戻る: 同音異義語の認識精度   目次
平成18年3月20日