問題2. で述べた観測系列の生成確率を最大にするモデル のパラメータの局所的最適値を求める方法として、 Baum-Welch アルゴリズム (パラメータ再推定法)があ る。
モデルが観測系列
を生成する場合に
おいて、時刻tで状態から状態に遷移する確率
を次のように定義する。
(2.11) | |||
(2.12) |
(2.13) | |||
(2.14) |
再推定されたの評価は次のようになる。
Baum-Welchアルゴリズムは、学習データの尤度を最大にするようにパラ メータを学習する。ただし、基本的にはgradient学習によるパラメータ収束の 学習方法であるため、local maxmumの方向にしか学習は進まない。そのた め初期値が重要になる。音響モデルでは通常left-lightモデルが使用されるため あまり問題にならないが、全ての状態が全ての状態に接続される Ergodic HMMでは、この初期値が特に問題になる[4]。