next up previous contents
次へ: Forwardアルゴリズム(トレリス法) 上へ: 音声認識 戻る: 半連続型HMM   目次

認識アルゴリズム

$ y = {y_1, y_2,\cdots, y_T}$ を観測(出力)系列とする.具体的には,スペク トルやケプストラムの時系 列である.このとき,各HMMモデルによって$ y$ が 生起する確率(尤度)$ P(y/M)$ はHMMによって 表現される単語や音素に対応)を求め,最大確率(最大尤度)を与えるモデルを選 んで,これを認識結果とする[6]. 図3にHMMを用いた単語音声認識の方法を示す.
図: HMMを用いた単語音声認識の方法
\includegraphics[scale=0.5]{rec_arg.eps}

尤度は, $ q = {q_{i0}, q_{i1}, ・・・, q_{iT}}$ を状態遷移行列(ただし $ q_{iT}
\in F)$ とすれば,式(20)と示される.

$\displaystyle P(y|M) = \sum_{i_0, i_1, …, i_T}P(y|q, M)・P(q|M)$ (20)

そして一般的に$ P(y|M)$ の値は, トレリスアルゴリズムで求め られる.

forward変数$ α(i, t)$ を定義し, 符号ベクトル$ y_t$ を出力して状態$ q_t$ に ある確率とすれば, $ i = 1, 2, ・・・, S$ とおいて, 式(21)を得る.

$\displaystyle α(i, t) = \sum_{j}α(j, t-1)・α_{ji}・b_{ji}(y_t)(t-1, 2, ・・・, T)・π_i(t=0)$ (21)

式(21)を計算し, 最後に式(22)を求めれば良い.

$\displaystyle P(y|M) = \sum_{i,q \in F}α(i,T)$ (22)



Subsections

平成24年3月20日