次へ: 単語音声認識精度
上へ: 同音異義語の認識精度
戻る: 半連続型HMM
目次
状態共有型HMMにおけるMFCCでのの同音異義語の認識精度を表18に示す.
FBANKでのの同音異義語の認識精度を表19に示す.
表 18:
状態共有型HMM, MFCC, Diagonalを用いた同音異義語の誤り率
話者 |
アクセントモデル |
アクセントtriphoneモデル |
mau |
36%(8/22) |
36%(8/22) |
mmy |
55%(12/22) |
36%(8/22) |
mnm |
41%(9/22) |
50%(11/22) |
faf |
27%(6/22) |
14%(3/22) |
fms |
18%(4/22) |
36%(8/22) |
ftk |
27%(6/22) |
32%(7/22) |
平均 |
34%(45/132) |
34%(45/132) |
表 19:
状態共有型HMM, FBANK, Diagonalを用いた同音異義語の誤り率
話者 |
アクセントモデル |
アクセントtriphoneモデル |
mau |
14%(3/22) |
45%(10/22) |
mmy |
55%(12/22) |
45%(10/22) |
mnm |
45%(10/22) |
50%(11/22) |
faf |
27%(6/22) |
36%(8/22) |
fms |
36%(8/22) |
27%(6/22) |
ftk |
33%(5/22) |
41%(9/22) |
平均 |
33%(44/132) |
41%(54/132) |
実験より以下の結果を得た.
- MFCCはFBANKより同音異義語の認識精度が高い.
- アクセントtriphoneモデルの方がアクセントモデルより同音異義語の認識
精度が高い.
- 状態共有型HMMの認識率は半連続型HMMと比べ低い.
- 最も同音異義語を認識できた実験では平均89%の精度が得られた.
次へ: 単語音声認識精度
上へ: 同音異義語の認識精度
戻る: 半連続型HMM
目次
平成18年3月20日