実験結果

次へ: 初期パラメータの違いによるモデルの変化 上へ: 連続音声認識への適用 戻る: 実験条件目次

実験結果

表 9.20 および図 9.16 に実験結果を示す。比較のため、言語モデルを用いない場合(音響モデルのみで認識した場合)と言語モデルとして単語bigram (言語尤度と音響尤度の結合値 $\alpha = 1$ )を用いた場合を合わせて示す。表中に示した()内の値は(正解を出力した文数/認識に用いた文数)である。

text-openの実験において Ergodic HMMは単語bigramを超えた認識性能が得られたことから、 Ergodic HMMは単語bigramよりもロバスト性があることがわかる。また、状態数が増えるにつれ、text-closedデータに対する認識率が上がることがわかる。

**表 9.20:** 認識実験の結果
言語モデル	文認識率
なし	29.0%		(11/38)
	text-open data		text-closed data
2状態Ergodic HMM	31.5%	(12/38)	34.2%	(13/38)
4状態Ergodic HMM	36.8%	(14/38)	39.5%	(15/38)
8状態Ergodic HMM	39.5%	(15/38)	47.3%	(18/38)
16状態Ergodic HMM	36.8%	(14/38)	----
単語bigram	34.3%	(13/38)	52.7%	(20/38)

**図 9.16:** 文認識実験結果
$\begin{figure}\begin{center} \epsfile{file=Ergodic-HMM/Figure/exp_res_recog.rate.ps,width=80mm} \end{center}\end{figure}$

Jin'ichi Murakami 平成13年1月5日