next up previous
次へ: ビーム幅 上へ: trigram model を使用した文認識システムの実験 戻る: ポーズのスキップ


ポーズの学習

不特定話者認識の実験において誤認識された結果を調べると、音声 データの最初のポーズ区間から誤認識していることがわかった。そ こでテストデータの先頭の無音区間を利用して、ポーズのHMMを再 学習して、認識実験を行なった。このときの実験結果を表  7 に載せる。これからわかるよう に認識性能がさらに向上した。そして不特定話者認識と特定 話者認識の認識率の差は、かなり小さくなった。また特定話者認識 において意味的に正しい文も正解に含めたとき、認識率 は99%に達した。



表 7: 認識実験の結果(ポーズのスキップ、ポーズ学習) 認識率(%)
model 特定話者認識 不特定話者認識
bigram 60.5% (158/261) 44.8% (117/261)
trigram 88.9% (232/261) 83.9% (219/261)
text-closed ビーム幅:4096 $\alpha $:1





Jin'ichi Murakami 平成13年10月4日