next up previous contents
次へ: Forwardアルゴリズム(トレリス法) 上へ: 音声認識 戻る: 半連続型HMM   目次

認識アルゴリズム

$ y = {y_1, y_2,\cdots, y_T}$ を観測(出力)系列とする.具体的には,スペク トルやケプストラムの時系 列である.このとき,各HMMモデルによって$ y$ が 生起する確率(尤度)$ P(y/M)$ はHMMによって 表現される単語や音素に対応)を求め,最大確率(最大尤度)を与えるモデルを選 んで,これを認識結果とする[4]. 図3にHMMを用いた単語音声認識の方法を示す.
図 3: HMMを用いた単語音声認識の方法
\includegraphics[scale=0.5]{rec_arg.eps}

$ q = {q_{i0}, q_{i1}, ・・・, q_{iT}}$ を状態遷移行列(ただし $ q_{iT}
\in F)$ とすれば,

$\displaystyle P(y|M) = \sum_{i_0, i_1, …, i_T}P(y|q, M)・P(q|M)$ (20)

と表すことができる.そして一般的に$ P(y|M)$ の値は, トレリスアルゴリズムで求め られる.

farward変数$ α(i, t)$ を定義し, 符号ベクトル$ y_t$ を出力して状態$ q_t$ に ある確率とすれば, $ i = 1, 2, ・・・, S$ とおいて, 以下の式を得る.

$\displaystyle α(i, t) = \sum_{j}α(j, t-1)・α_{ji}・b_{ji}(y_t)(t-1, 2, ・・・, T)・π_i(t=0)$ (21)

これを計算し, 最後に以下を求めれば良い.

$\displaystyle P(y|M) = \sum_{i,q \in F}α(i,T)$ (22)



Subsections

平成20年5月16日