次へ: 単語音声認識精度
上へ: 実験結果
戻る: 実験結果
目次
Diagonal-covarianceで行った同音異義語認識の実験結果を表 11 に,Full-covarianceで行った実験結果を表 12に示す.
表中の括弧内の分母は評価データ中の同音異義語の数である.そして,分子の数字は誤認識した同音異義語を示す.
表 11:
Diagonalを用いた同音異義語の誤り率
話者 |
MFCC |
FBANK |
mau |
18%(4/22) |
5%(1/22) |
mmy |
14%(3/22) |
18%(4/22) |
mnm |
14%(3/22) |
9%(2/22) |
faf |
0%(0/22) |
0%(0/22) |
fms |
14%(3/22) |
18%(4/22) |
ftk |
5%(1/22) |
5%(1/22) |
平均 |
11%(14/132) |
9%(12/132) |
表 12:
Fullを用いた同音異義語の誤り率
話者 |
MFCC |
FBANK |
mau |
9%(2/22) |
5%(1/22) |
mmy |
9%(2/22) |
0%(0/22) |
mnm |
5%(1/22) |
9%(2/22) |
faf |
0%(0/22) |
0%(0/22) |
fms |
14%(3/22) |
5%(1/22) |
ftk |
9%(2/22) |
0%(0/22) |
平均 |
8% (10/132) |
3%(4/132) |
実験の結果,Diagonal-covariance,Full-covariance共通してFBANKを用いた特徴パラメータの方がMFCCよりアクセントの認識精度が高かった.また比較的多くの同音異義語を誤認識していた話者mmy,fmsの認識率がFBANKのFull-covarianceでは,Diagonal-covarianceと比較して改善されていた.
最も同音異義語を認識できた実験では平均97%の精度が得られた.
次へ: 単語音声認識精度
上へ: 実験結果
戻る: 実験結果
目次
平成16年4月17日