next up previous contents
次へ: 単語音声認識精度 上へ: 同音異義語の認識精度 戻る: 半連続型HMM   目次

状態共有型HMM

状態共有型HMMにおけるMFCCでのの同音異義語の認識精度を表18に示す. FBANKでのの同音異義語の認識精度を表19に示す.


表 18: 状態共有型HMM, MFCC, Diagonalを用いた同音異義語の誤り率
話者 アクセントモデル アクセントtriphoneモデル
mau 36%(8/22) 36%(8/22)
mmy 55%(12/22) 36%(8/22)
mnm 41%(9/22) 50%(11/22)
faf 27%(6/22) 14%(3/22)
fms 18%(4/22) 36%(8/22)
ftk 27%(6/22) 32%(7/22)
平均 34%(45/132) 34%(45/132)


表 19: 状態共有型HMM, FBANK, Diagonalを用いた同音異義語の誤り率
話者 アクセントモデル アクセントtriphoneモデル
mau 14%(3/22) 45%(10/22)
mmy 55%(12/22) 45%(10/22)
mnm 45%(10/22) 50%(11/22)
faf 27%(6/22) 36%(8/22)
fms 36%(8/22) 27%(6/22)
ftk 33%(5/22) 41%(9/22)
平均 33%(44/132) 41%(54/132)

実験より以下の結果を得た.

  1. MFCCはFBANKより同音異義語の認識精度が高い.
  2. アクセントtriphoneモデルの方がアクセントモデルより同音異義語の認識 精度が高い.
  3. 状態共有型HMMの認識率は半連続型HMMと比べ低い.
  4. 最も同音異義語を認識できた実験では平均89%の精度が得られた.


next up previous contents
次へ: 単語音声認識精度 上へ: 同音異義語の認識精度 戻る: 半連続型HMM   目次
平成18年3月20日