next up previous contents
次へ: 特定話者実験の半連続型HMM 上へ: 単語音声認識精度 戻る: 単語音声認識精度   目次

状態数無調整の状態共有型HMM

状態数を調整していない状態共有型HMM, MFCCでの単語認識精度を表 39に示す. また, FBANKでの単語認識精度を表 40に示す. 状態数を制御する閾値が一定であるために, 状 態数は各実験条件とモデルによって異なる. 状態数以外の実験条件は, 本研究での実 験条件と同一である. MFCCでの状態数を表26に, FBANK での状態数を表27に示す.


表 39: 状態数無調整の状態共有型HMM,MFCC,diagonalの単語誤り率
基本モデル triphone モーラ アクセ ント モーラ アクセント
モデル モデル モデル triphoneモデル triphoneモデル
mau 22.98% 4.35% 14.52% 14.27% 4.58% 4.01%
(602/2620) (114/2620) (383/2620) (374/2620) (120/2620) (105/2620)
mmy 23.09% 8.97% 18.09% 16.49% 9.27% 7.10%
(605/2620) (235/2620) (474/2620) (432/2620) (243/2620) (186/2620)
mnm 22.56% 4.16% 17.14% 16.49% 4.05% 3.70%
(591/2620) (109/2620) (449/2620) (432/2620) (106/2620) (97/2620)
faf 21.41% 5.53% 14.01% 12.48% 5.73% 4.73%
(561/2620) (145/2620) (367/2620) (327/2620) (150/2620) (124/2620)
fms 27.21% 5.92% 16.79% 14.73% 5.53% 4.96%
(713/2620) (155/2620) (440/2620) (386/2620) (145/2620) (130/2620)
ftk 22.75% 9.69% 12.82% 11.79% 8.93% 8.28%
(596/2620) (254/2620) (336/2620) (309/2620) (234/2620) (217/2620)
平均 23.33% 6.44% 15.58% 14.38% 6.35% 5.46%
(3668/15720) (1012/15720) (2449/15720) (2260/15720) (998/15720) (859/15720)


表 40: 状態数無調整の状態共有型HMM,FBANK,diagonalの単語誤り率
基本モデル triphone モーラ アクセント モーラ アクセント
モデル モデル モデル triphoneモデル triphoneモデル
mau 41.64% 13.36% 12.60% 11.56% 12.67% 12.63%
(1091/2620) (350/2620) (330/2620) (303/2620) (332/2620) (331/2620)
mmy 50.46% 7.56% 18.47% 19.43% 8.32% 7.86%
(1322/2620) (198/2620) (484/2620) (509/2620) (218/2620) (206/2620)
mnm 42.79% 8.05% 16.26% 15.27% 7.82% 6.53%
(1121/2620) (211/2620) (426/2620) (400/2620) (205/2620) (171/2620)
faf 34.58% 8.05% 12.79% 11.11% 8.24% 6.79%
(906/2620) (211/2620) (335/2620) (291/2620) (216/2620) (178/2620)
fms 46.15% 6.64% 19.54% 17.33% 6.91% 4.69%
(1209/2620) (174/2620) (512/2620) (454/2620) (181/2620) (123/2620)
ftk 51.22% 10.84% 16.26% 10.99% 10.46% 9.50%
(1342/2620) (284/2620) (426/2620) (288/2620) (274/2620) (249/2620)
平均 44.47% 9.08% 15.99% 14.28% 9.07% 8.00%
(6991/15720) (1428/15720) (2513/15720) (2245/15720) (1426/15720) (1258/15720)


next up previous contents
次へ: 特定話者実験の半連続型HMM 上へ: 単語音声認識精度 戻る: 単語音声認識精度   目次
平成18年3月20日