次へ: HMM法の利点と問題点
上へ: HMM(隠れマルコフモデル)
戻る: HMM(隠れマルコフモデル)
目次
音声認識は,パターン認識の一分野である.音声波形から認識に有効な特徴パラメータが抽出された後は、通常のパターン認識の技術と本質的に変わりはない.通常のパターン認識との違いは,音声パターンが時系列パターンであることと言語情報の制約を受けることである.
パターン認識には構造的・構文的パターン認識法と統計的・確率的パターン認識法が存在する.最近になって,音声パターンの時系列パターンに対しての統計的・確率的パターン認識法がHMM(Hidden Markov Model;隠れマルコフモデル)による手法である.
HMMは,出力シンボルによって一意に状態遷移先が決まらないという意味での非決定状態オートマトンとして定義される.
このモデルでは,状態と出力シンボルの2過程を考え,状態が確率的に遷移するときに対応して確率的にシンボルを出力する.
このとき観測できるのはシンボル系列だけであることから,Hidden(隠れ)マルコフモデルとよばれている.
HMMによる音声認識では,各カテゴリのHMMに対して入力パターンの特徴パラメータ時系列に対する尤度を求め,それを最大にするモデルに対応するカテゴリを認識結果とするのが基本手法である.
HMMは以下の組から定義される.
- 状態の有限集合;
- 出力シンボルの集合;
- 状態遷移確率の集合;
;
は状態
から 状態
への遷移確率,ここで
.
- 出力確率の集合;
;
は状態
から
においてシンボル
を出力する確率.
- 初期状態確率の集合;
;
は初期状態が
である確率,
.
- 最終状態の集合;
平成24年3月20日