HMMを用いた音声認識

次へ: HMM法の利点と問題点 上へ: HMM(隠れマルコフモデル) 戻る: HMM(隠れマルコフモデル) 目次

HMMを用いた音声認識

音声認識は,パターン認識の一分野である.音声波形から認識に有効な特徴パラメータが抽出された後は、通常のパターン認識の技術と本質的に変わりはない.通常のパターン認識との違いは,音声パターンが時系列パターンであることと言語情報の制約を受けることである. パターン認識には構造的・構文的パターン認識法と統計的・確率的パターン認識法が存在する。最近になって,音声パターンの時系列パターンに対しての統計的・確率的パターン認識法がHMM(Hidden Markov Model;隠れマルコフモデル)による手法である [] .

HMMは,出力シンボルによって一意に状態遷移先が決まらないという意味での非決定状態オートマトンとして定義される. このモデルでは,状態と出力シンボルの2課程を考え,状態が確率的に遷移するときに対応して確率的にシンボルを出力する. このとき観測できるのはシンボル系列だけであることからHidden(隠れ)マルコフモデルとよばれている.

HMMによる音声認識では,各カテゴリのHMMに対して入力パターンの特徴パラメータ時系列に対する尤度を求め,それを最大にするモデルに対応するカテゴリを認識結果とするのが基本手法である.

HMMは以下の組から定義される.