ポーズの学習

次へ: ビーム幅 上へ: trigram model を使用した文認識システムの実験 戻る: ポーズのスキップ

ポーズの学習

不特定話者認識の実験において誤認識された結果を調べると、音声データの最初のポーズ区間から誤認識していることがわかった。そこでテストデータの先頭の無音区間を利用して、ポーズのHMMを再学習して、認識実験を行なった。このときの実験結果を表 7 に載せる。これからわかるように認識性能がさらに向上した。そして不特定話者認識と特定話者認識の認識率の差は、かなり小さくなった。また特定話者認識において意味的に正しい文も正解に含めたとき、認識率は99%に達した。

**表 7:** 認識実験の結果（ポーズのスキップ、ポーズ学習）認識率(%)
model	特定話者認識	不特定話者認識
bigram	60.5% (158/261)	44.8% (117/261)
trigram	88.9% (232/261)	83.9% (219/261)

text-closed ビーム幅:4096 $\alpha$ :1

Jin'ichi Murakami 平成13年10月4日