next up previous contents
次へ: 初期パラメータの違いによるモデルの変化 上へ: 連続音声認識への適用 戻る: 実験条件   目次


実験結果

表 9.20 および図 9.16 に実験結果 を示す。比較のため、言語モデルを用いない場合(音響モデルのみで認識した 場合)と言語モデルとして単語bigram (言語尤度と音響尤度の結合値 $\alpha
= 1$)を用いた場合を合わせて示す。表中に示した()内の値は(正解を出力した 文数/認識に用いた文数)である。

text-openの実験において Ergodic HMMは 単語bigramを超えた認識性能が得られたことから、 Ergodic HMMは単語bigramよりもロバスト性があることがわかる。 また、状態数が増えるにつれ、text-closedデー タに対する認識率が上がることがわかる。


表 9.20: 認識実験の結果
言語モデル 文認識率
なし 29.0% (11/38)
  text-open data text-closed data
 2状態Ergodic HMM 31.5% (12/38) 34.2% (13/38)
 4状態Ergodic HMM 36.8% (14/38) 39.5% (15/38)
 8状態Ergodic HMM 39.5% (15/38) 47.3% (18/38)
16状態Ergodic HMM 36.8% (14/38) ----  
単語bigram 34.3% (13/38) 52.7% (20/38)

図 9.16: 文認識実験結果
\begin{figure}\begin{center}
\epsfile{file=Ergodic-HMM/Figure/exp_res_recog.rate.ps,width=80mm}
\end{center}\end{figure}



Jin'ichi Murakami 平成13年1月5日