next up previous contents
次へ: 考察 上へ: 連続音声認識への適用 戻る: 実験結果   目次


初期パラメータの違いによるモデルの変化

Ergodic HMMのパラメータの初期値の違いによる生成されるモデルの変化を研究 するために、初期値の異なる8状態Ergodic HMMを8個用意し、odd4000を学習させ た。初期値が異なること以外はすべて同一条件で学習を行ない、パラメータの再 推定回数20回を学習の終了条件とした。初期パラメータは  9.2.3 節で示した方法で決定した。

表 9.21 に学習終了後の各Ergodic HMMのエントロピー、 学習データodd4000の平均尤度、音声認識に用いた場合のtext-closed dataに 対する認識率などを示す。表中、一番左は各Ergodic HMMを区別するために番 号をつけた。なお表中の1は、 3 節で得られた、学 習終了条件を尤度の上昇率1%未満にした場合の結果である。


表 9.21: 初期値の違いによる生成モデルの変化
  学習回数 エントロピー 平均尤度 認識率
    初期状態 学習後 初期状態 学習後  
1 749 12.61 5.99 -126.39 -62.93 47.3%
2 20   6.21 -126.53 -64.48 42.1%
3 20   6.14 -126.36 -64.36 39.5%
4 20   6.03 -126.43 -63.68 44.7%
5 20   6.27 -126.10 -64.71 34.2%
6 20   6.09 -126.41 -64.95 36.8%
7 20   6.10 -126.24 -64.06 36.8%
8 20   6.16 -126.47 -64.62 39.5%
9 20   6.13 -126.32 -65.07 31.6%

表 9.21 から、パラメータの初期値によって、生成さ れたモデルのエントロピーや平均尤度が異なることがわかる。これを音声認識 の言語モデルに用いた場合、学習回数の異なる1を除いた8種のErgodic HMM間 で、認識率の最高値(4のErgodic HMM)と最低値(9のErgodic HMM)の差は約 13%(5文)と、初期モデルの違いでかなりの違いが見られる。

なお、学習後の平均尤度と認識率の関係を図  9.17 に示す。

図 9.17: 文認識結果
\begin{figure}\begin{center}
\epsfile{file=Ergodic-HMM/Figure/seisei-ninsiki.ps,width=80mm}
\end{center}\end{figure}

学習させた回数が20回で十分でなかったことやデータが8種類しかないことなどから明確ではないが、図  9.17 から、エントロピーと Ergodic HMM には相関があることがわかる。


next up previous contents
次へ: 考察 上へ: 連続音声認識への適用 戻る: 実験結果   目次
Jin'ichi Murakami 平成13年1月5日