next up previous contents
次へ: 特定話者実験の状態共有型HMM 上へ: 同音異義語の認識精度 戻る: 状態数無調整の状態共有型HMM   目次

特定話者実験の半連続型HMM

特定話者における半連続型HMMを用いたMFCC, Diagonalのアクセントモデルの同 音異義語の認識精度を表30に示す. また, FBANK, Diagonal の同音異義語の認識精度を表31に示す. 表 30, 31の実験結果は[12]での結 果であり, 実験条件は[12]に示されている.

また, [12]の条件でstream数と混合分布数が異なる実験結果を示す. MFCC, Diagonalの同音異義語認識精度を表32に, FBANK, Diagonalの同音異義語認識精度を表34に, MFCC, Fullの同音異義 語認識精度を表33 に示す.


表 30: 特定話者におけるアクセントモデル, 半連続型HMM, MFCCを用いた同音異 義語誤り率
話者 Diagonal Full
mau 18%(4/22) 9%(2/22)
mmy 14%(3/22) 9%(2/22)
mnm 14%(3/22) 5%(1/22)
faf 0%(0/22) 5%(0/22)
fms 14%(3/22) 14%(3/22)
ftk 5%(1/22) 9%(2/22)
平均 11%(14/132) 8%(10/132)


表 31: 特定話者におけるアクセントモデル, 半連続型HMM, FBANKを用いた同音 異義語誤り率
話者 Diagonal Full
mau 5%(1/22) 5%(1/22)
mmy 18%(4/22) 0%(0/22)
mnm 9%(2/22) 9%(2/22)
faf 0%(0/22) 0%(0/22)
fms 18%(4/22) 5%(1/22)
ftk 5%(1/22) 0%(0/22)
平均 9%(12/132) 3%(4/132)


表 32: 特定話者における半連続型HMM,MFCC,Diagonal,stream数1,混合分布数 256の同音異義語誤り率
  アクセントモデル アクセントtriphoneモデル
mau 27%(6/22) 23%(5/22)
mmy 13%(3/22) 18%(4/22)
mnm 13%(3/22) 23%(5/22)
faf 22%(5/22) 27%(6/22)
fms 18%(4/22) 9%(2/22)
ftk 4%(1/22) 9%(2/22)
平均 16%(22/132) 18%(24/132)


表 33: 特定話者における半連続型HMM,MFCC,Full,stream数1,混合分布数256の同音異義語誤り率
  アクセントモデル
mau 31%(7/22)
mmy 4%(1/22)
mnm 27%(6/22)
faf 4%(1/22)
fms 13%(3/22)
ftk 9%(2/22)
平均 14%(20/132)


表 34: 特定話者における半連続型HMM,FBANK,Diagonal,stream数3,混合 分布数 256,256,32の同音異義語誤り率
  アクセントモデル
mau 0%(0/22)
mmy 5%(1/22)
mnm 5%(1/22)
faf 0%(0/22)
fms 9%(2/22)
ftk 14%(3/22)
平均 5%(7/132)

30, 31の実験より以下の結果を得た.

  1. MFCCよりFBANKを用いた特徴パラメータの方がアクセントの認識精度が高 い.
  2. 最も同音異義語を認識できたFBANK, Fullの実験では平均97%の精度が得 られた.


next up previous contents
次へ: 特定話者実験の状態共有型HMM 上へ: 同音異義語の認識精度 戻る: 状態数無調整の状態共有型HMM   目次
平成18年3月20日