HMMは、不確定な時系列のデータをモデル化するための有効な統計的 手法である[4]。HMMは、出力シンボルによって一意に状態遷移先が 決まらないという意味での非決定性確率有限オートマトンとして定義される。 出力シンボル系列が与えられても状態遷移系列は唯一に決まらない。観測でき るのはシンボル系列だけであることからhidden(隠れ)マルコフモデルと呼ば れる [60]。
HMMはパラメータとして状態遷移確率、シンボル出力確率、初期状態確率を持 つ。そして、シンボル出力確率の計算方法によって離散型HMMと連続分布型HMM に別れる。また、シンボル出力確率が状態で出力されるMooreマシンと状態遷 移で出力されるMealyマシンに分類できる。以下では、Mealyタイプの離散型 HMMについて述べる[60]。なお、MooreタイプとMealyタイプは相互 に変換可能である。
: 観測系列の長さ | |
: 観測系列 | |
: 状態数 | |
: 観測シンボルの数 | |
: 状態集合 | |
: 時刻の時の状態(番号) | |
: 状態番号 | |
: 出力可能なシンボル集合 |
と定義すると、このオートマトンは,状態遷移確率,シンボル出力 確率,初期状態確率は、以下のように示される。
(2.1) | |||
(2.2) | |||
(2.3) |
これらのパラメーターを用いて、HMMを次のように略記する。
(2.4) |
観測系列が
HMMには、ある状態から全ての状態に遷移できる全遷移型(Ergodic)モデルや、 状態遷移が一定方向に進む left to right モデルがある。図 2.1 に簡単なHMM(left to right モデル)の例を示 す。
このHMMは三つの状態で構成され、2種類の
ラベルaとbのみからなるラベル系列を出力する。初期状態確率は
、最終状態をとし、図のような
遷移のみ行なうものとする。図において、0.3などアークに添えら
れている数字は状態遷移確率を表し、[ ]内の数字の上段はラベルa
の出力確率、下段はラベルbの出力確率を表す。状態を例にと
れば、から状態自身に0.3の確率で遷移し、遷移の際に0.8
の確率でaを出力し、0.2の確率でbを出力する。他の状態、遷移に
ついても同様である。ここで、ラベル系列がaabを出力する確率を
考える。このHMMで許される状態系列において''aab''を出力する
可能性のあるものは、
と
と
の3種類で、それぞれの
確率は、
よって、このHMMがaabを出力する確率は三つの合計、
HMMでは状態系列に意味を持たないが、最尤の経路を推定することはできる。 この例では、aabを出力する可能性がもっとも高い状態系列は、前記の計算か ら容易に とわかる (2.1.7参照)。