next up previous contents
次へ: 単語音声認識精度 上へ: 実験結果 戻る: 実験結果   目次

同音異義語の認識精度

Diagonal-covarianceで行った同音異義語認識の実験結果を表 11 に,Full-covarianceで行った実験結果を表 12に示す. 表中の括弧内の分母は評価データ中の同音異義語の数である.そして,分子の数字は誤認識した同音異義語を示す.


表 11: Diagonalを用いた同音異義語の誤り率
話者 MFCC FBANK
mau 18%(4/22) 5%(1/22)
mmy 14%(3/22) 18%(4/22)
mnm 14%(3/22) 9%(2/22)
faf 0%(0/22) 0%(0/22)
fms 14%(3/22) 18%(4/22)
ftk 5%(1/22) 5%(1/22)
平均 11%(14/132) 9%(12/132)


表 12: Fullを用いた同音異義語の誤り率
話者 MFCC FBANK
mau 9%(2/22) 5%(1/22)
mmy 9%(2/22) 0%(0/22)
mnm 5%(1/22) 9%(2/22)
faf 0%(0/22) 0%(0/22)
fms 14%(3/22) 5%(1/22)
ftk 9%(2/22) 0%(0/22)
平均 8% (10/132) 3%(4/132)

実験の結果,Diagonal-covariance,Full-covariance共通してFBANKを用いた特徴パラメータの方がMFCCよりアクセントの認識精度が高かった.また比較的多くの同音異義語を誤認識していた話者mmy,fmsの認識率がFBANKのFull-covarianceでは,Diagonal-covarianceと比較して改善されていた. 最も同音異義語を認識できた実験では平均97%の精度が得られた.


next up previous contents
次へ: 単語音声認識精度 上へ: 実験結果 戻る: 実験結果   目次
平成16年4月17日