同音異義語の認識精度

次へ: 単語音声認識精度 上へ: 実験結果 戻る: 実験結果目次

同音異義語の認識精度

Diagonal-covarianceで行った同音異義語認識の実験結果を表 11 に,Full-covarianceで行った実験結果を表 12に示す. 表中の括弧内の分母は評価データ中の同音異義語の数である.そして,分子の数字は誤認識した同音異義語を示す.

**表 11:** Diagonalを用いた同音異義語の誤り率
話者	MFCC	FBANK
mau	18%(4/22)	5%(1/22)
mmy	14%(3/22)	18%(4/22)
mnm	14%(3/22)	9%(2/22)
faf	0%(0/22)	0%(0/22)
fms	14%(3/22)	18%(4/22)
ftk	5%(1/22)	5%(1/22)
平均	11%(14/132)	9%(12/132)

**表 12:** Fullを用いた同音異義語の誤り率
話者	MFCC	FBANK
mau	9%(2/22)	5%(1/22)
mmy	9%(2/22)	0%(0/22)
mnm	5%(1/22)	9%(2/22)
faf	0%(0/22)	0%(0/22)
fms	14%(3/22)	5%(1/22)
ftk	9%(2/22)	0%(0/22)
平均	8% (10/132)	3%(4/132)

実験の結果,Diagonal-covariance,Full-covariance共通してFBANKを用いた特徴パラメータの方がMFCCよりアクセントの認識精度が高かった.また比較的多くの同音異義語を誤認識していた話者mmy,fmsの認識率がFBANKのFull-covarianceでは,Diagonal-covarianceと比較して改善されていた. 最も同音異義語を認識できた実験では平均97%の精度が得られた.

次へ: 単語音声認識精度 上へ: 実験結果 戻る: 実験結果目次

平成16年4月17日