次へ: ビーム幅
上へ: trigram model を使用した文認識システムの実験
戻る: ポーズのスキップ
ポーズの学習
不特定話者認識の実験において誤認識された結果を調べると、音声
データの最初のポーズ区間から誤認識していることがわかった。そ
こでテストデータの先頭の無音区間を利用して、ポーズのHMMを再
学習して、認識実験を行なった。このときの実験結果を表
7 に載せる。これからわかるよう
に認識性能がさらに向上した。そして不特定話者認識と特定
話者認識の認識率の差は、かなり小さくなった。また特定話者認識
において意味的に正しい文も正解に含めたとき、認識率
は99%に達した。
表 7:
認識実験の結果(ポーズのスキップ、ポーズ学習) 認識率(%)
model |
特定話者認識 |
不特定話者認識 |
bigram |
60.5% (158/261) |
44.8% (117/261) |
trigram |
88.9% (232/261) |
83.9% (219/261) |
text-closed ビーム幅:4096
:1
Jin'ichi Murakami
平成13年10月4日