を観測(出力)系列とする.具体的には,スペクト
ルやケプストラムベクトルの時系列である.このとき,各HMMモデルによって
が生起
する確率(尤度)
(ここで
はHMMによって表現される単語や音素に対応)
を求め,
最大確率(最大尤度)を与えるモデルを選んで,これを認識結果とする.単語音声
認識システムの流れを図3に示す.本研究で扱う処理は破線で囲
われた範囲である.
を状態遷移行列(ただし
とすれば,
![]() |
(2) |
と表すことができる.そして一般的にの値は,トレリスアルゴリズムで求められる.
フォワード変数
を定義し,符号ベクトル
を出力して状態
に
ある確率とすれば,
とおいて,以下の式を得る.
![]() |
(3) |
これを計算し,最後に以下を求めれば良い.
![]() |
(4) |
を厳密に求めないで,モデルMが符号ベクトル系列
を出力するときの
最も可能性の高い状態系列上での出現確率を用いるViterbiアルゴリズムと呼ば
れる方法もある.尤度は,各遷移での確率値を対数変換しておくことで高速に求
めることができる.このアルゴリズムを以下に示す.
にお
いて,
![]() |
(5) |
![]() |
(6) |
このためViterbiアルゴリズムは広く用いられている.