まとめ

次へ: まとめ 上へ: tree-trellisサーチと単語のtrigramモデルを用いた文音声認識 戻る: 考察目次

まとめ

本章では、単語trigramを利用した実験結果を報告した。実験の結果、朗読発話のtext-closed dataにおいて特定話者認識では66.7%の文認識率が得られた。

この論文ではtree-trellisサーチを利用している。したがって、各時刻・各状態において累積尤度が最大の単語列を知ることができる。この特徴を生かして、音響モデルではポーズを認識しながら言語モデルではポーズをスキップすることにより、ポーズによる誤認識を削減できる。また、テストデータの先頭の無音区間を利用して、ポーズのHMMを再学習した。このようなポーズの処理をすることにより不特定話者認識のtext-closed dataにおいて83.9%の文認識率が得られた。

これらの実験の結果、このアルゴリズムの有効性が示された。

Jin'ichi Murakami 平成13年1月5日