next up previous contents
次へ: エントロピー 上へ: Ergodic HMMを用いた確率つきネットワーク文法の獲得 戻る: 実験条件   目次

状態数と値を持つシンボル出力の数

状態数の増加にともなう、値を持つ(確率値が0.0ではない)シンボル出力確 率のパラメータ数の変化を基本的なBaum-Welchアルゴリズムを使用した場合と、本節で 提案した学習アルゴリズムを使用した場合の両者を図  9.20 に示した。

横軸はErgodic HMMの状態数で縦軸は、値を持つシンボル出力確率のパラメー タ数である。

図 9.20: HMMの状態数に対するシンボル出力確率の数の変化
\begin{figure}\begin{center}
\fbox{\epsfile{file=Ergodic-HMM/Large-State/figure1.ps,width=100mm}}\end{center}\end{figure}

この図から、本手法で学習した場合のパラメータ数は、通常の学習のパラメー タ数より大幅に減少することがわかる。状態数512 のErgodic-HMMにお いて、シンボル出力確率に値があるものは2106967 個であった。したがって本 稿で提案したアルゴリズムは基本的なBaum-Welchアルゴリズムと比較すると、 メモリ量および計算量を0.125% に削減していることがわかる。

ただし、同一の言語データにおける単語のbigramのパラメータの数は37,752、単語のtrigramで は78,138であった。この値と比較すると、Ergodic-HMMのパラメータ数はかなり多いといえる。



Jin'ichi Murakami 平成13年1月5日