next up previous contents
次へ: まとめ 上へ: tree-trellisサーチと単語のtrigramモデルを用いた文音声認識 戻る: 考察   目次

まとめ

本章では、単語trigramを利用した実験結果を報告した。実験の結果、朗読 発話のtext-closed dataにおいて特定話者認識では66.7%の文認識率が得られ た。

この論文ではtree-trellisサーチを利用している。したがって、各時刻・各状態 において累積尤度が最大の単語列を知ることができる。この特徴を生かして、 音響モデルではポーズを認識しながら言語モデルではポーズをスキップするこ とにより、ポーズによる誤認識を削減できる。また、テストデータの先頭の無 音区間を利用して、ポーズのHMMを再学習した。このようなポーズの処理をす ることにより不特定話者認識のtext-closed dataにおいて83.9%の文認識率が 得られた。

これらの実験の結果、このアルゴリズムの有効性が示された。



Jin'ichi Murakami 平成13年1月5日