を観測(出力)系列とする.具体的には,スペクト ルやケプストラムベクトルの時系列である.このとき,各HMMモデルによって が生起 する確率(尤度)(ここではHMMによって表現される単語や音素に対応) を求め, 最大確率(最大尤度)を与えるモデルを選んで,これを認識結果とする.単語音声 認識システムの流れを図3に示す.本研究で扱う処理は破線で囲 われた範囲である.
を状態遷移行列(ただしとすれば,
(2) |
と表すことができる.そして一般的にの値は,トレリスアルゴリズムで求められる. フォワード変数を定義し,符号ベクトルを出力して状態に ある確率とすれば, とおいて,以下の式を得る.
(3) |
これを計算し,最後に以下を求めれば良い.
(4) |
を厳密に求めないで,モデルMが符号ベクトル系列を出力するときの 最も可能性の高い状態系列上での出現確率を用いるViterbiアルゴリズムと呼ば れる方法もある.尤度は,各遷移での確率値を対数変換しておくことで高速に求 めることができる.このアルゴリズムを以下に示す. にお いて,
(5) |
(6) |
このためViterbiアルゴリズムは広く用いられている.