認識アルゴリズム

次へ: Forwardアルゴリズム(トレリス法) 上へ: 音声認識 戻る: 半連続型HMM 目次

$y = {y_1, y_2,\cdots, y_T}$ を観測(出力)系列とする．具体的には，スペクトルやケプストラムの時系列である．このとき，各HMMモデルによって

が生起する確率(尤度)

はHMMによって表現される単語や音素に対応)を求め，最大確率(最大尤度)を与えるモデルを選んで，これを認識結果とする[4]．図3にHMMを用いた単語音声認識の方法を示す．

**図 3:** HMMを用いた単語音声認識の方法
$\includegraphics[scale=0.5]{rec_arg.eps}$

$q = {q_{i0}， q_{i1}，・・・， q_{iT}}$ を状態遷移行列(ただし $q_{iT} \in F)$ とすれば，

$\displaystyle P(y｜M) ＝ \sum_{i_0， i_1， …， i_T}P(y｜q， M)・P(q｜M)$

(20)

と表すことができる．そして一般的に

の値は，トレリスアルゴリズムで求められる．

farward変数を定義し，符号ベクトルを出力して状態にある確率とすれば，とおいて，以下の式を得る．

$\displaystyle α(i， t) ＝ \sum_{j}α(j， t-1)・α_{ji}・b_{ji}(y_t)(t-1， 2，・・・， T)・π_i(t=0)$

(21)

これを計算し，最後に以下を求めれば良い．

$\displaystyle P(y｜M) = \sum_{i，q \in F}α(i，T)$

(22)

平成20年5月16日