不特定話者認識の実験において誤認識された結果を調べると、音声 データの最初のポーズ区間から誤認識していることがわかった。そ こでテストデータの先頭の無音区間を利用して、ポーズのHMMを再 学習して、認識実験を行なった。このときの実験結果を表 7 に載せる。これからわかるよう に認識性能がさらに向上した。そして不特定話者認識と特定 話者認識の認識率の差は、かなり小さくなった。また特定話者認識 において意味的に正しい文も正解に含めたとき、認識率 は99%に達した。
model | 特定話者認識 | 不特定話者認識 |
bigram | 60.5% (158/261) | 44.8% (117/261) |
trigram | 88.9% (232/261) | 83.9% (219/261) |