next up previous contents
次へ: HMMの種類 上へ: HMMによる音声認識 戻る: HMMとは   目次

HMMを用いた音声認識

音声認識は,パターン認識の一分野である.音声波形から認識に有効な特徴パラ メータが抽出された後は,通常のパターン認識の技術と本質的に変わりはない. 通常のパターン認識との違いは,音声パターンが時系列パターンであることと言 語情報の制約を受けることである.パターン認識には構造的・構文的パターン認 識法と統計的・確率的パターン認識法が存在する。最近になって,音声パターン の時系列パターンに対しての統計的・確率的パターン認識法がHMM(Hidden Markov Model:隠れマルコフモデル)による手法である.

HMMは,出力シンボルによって一意に状態遷移先が決まらないという意味での非決 定状態オートマトンとして定義される.このモデルでは,状態と出力シンボルの2 課程を考え,状態が確率的に遷移するときに対応して確率的にシンボルを出力す る.このとき観測できるのはシンボル系列だけであることからHidden(隠れ)マル コフモデルとよばれる.

HMMによる音声認識では,各カテゴリのHMMに対して入力パターンの特徴パラメー タ時系列に対する尤度を求め,それを最大にするモデルに対応するカテゴリを認 識結果とするのが基本手法である.

HMMは以下の組から定義される.

出力シンボルを連続値として表す場合と,有限個のシンボルの組み合わせで表現 する場合があり,以下のように分類される.



平成20年3月11日