next up previous contents
次へ: 日本語の-gramによるモデル化 上へ: 連続音声認識システムに使用するアルゴリズム 戻る: 単語のtrigramを使用したときのViterbiサーチ   目次

まとめ

本章では、HMMの基本アルゴリズムとBaum-Welchアルゴリズムについ て述べた。Baum-Welchアルゴリズムは、学習データの尤度を最大にするようにパラ メータを学習する。ただし、基本的にはgradient学習によるパラメータ収束の 学習方法であるため、local maxmumの方向にしか学習は進まない。そのた め初期値が重要になる。

次に連続音声認識アルゴリズムとしてフレーム同期型のtree-trellisサーチ とViterbiサーチについて述べた。実際使用されて いる認識アルゴリズムはViterbiサーチが多いと思われる。しかし、尤も基本 的なtree-trellisサーチにもN-best候補が出せるなどの長所がある。

最後に実用的な音声認識のためのアルゴリズムについて報告した。実際の tree-trellisサーチやViterbiサーチのプログラムをインプリメントしてもメ モリー量や計算量の関係から動かないことから実用的ではない。そこで、ビー ムサーチなどの様々な手法が使用される。本論文では、ビームの絞り方や、 近接したフレームにおける言語モデルの類似性の利用、単語trigramの値の検 索方法などについて述べたが、この他にも様々な方法が提案されている [32]。



Jin'ichi Murakami 平成13年1月5日