次へ: 初期パラメータの違いによるモデルの変化
上へ: 連続音声認識への適用
戻る: 実験条件
  目次
実験結果
表 9.20 および図 9.16 に実験結果
を示す。比較のため、言語モデルを用いない場合(音響モデルのみで認識した
場合)と言語モデルとして単語bigram (言語尤度と音響尤度の結合値
)を用いた場合を合わせて示す。表中に示した()内の値は(正解を出力した
文数/認識に用いた文数)である。
text-openの実験において
Ergodic HMMは
単語bigramを超えた認識性能が得られたことから、
Ergodic HMMは単語bigramよりもロバスト性があることがわかる。
また、状態数が増えるにつれ、text-closedデー
タに対する認識率が上がることがわかる。
表 9.20:
認識実験の結果
言語モデル |
文認識率 |
なし |
29.0% |
(11/38) |
|
text-open data |
text-closed data |
2状態Ergodic HMM |
31.5% |
(12/38) |
34.2% |
(13/38) |
4状態Ergodic HMM |
36.8% |
(14/38) |
39.5% |
(15/38) |
8状態Ergodic HMM |
39.5% |
(15/38) |
47.3% |
(18/38) |
16状態Ergodic HMM |
36.8% |
(14/38) |
---- |
|
単語bigram |
34.3% |
(13/38) |
52.7% |
(20/38) |
図 9.16:
文認識実験結果
 |
Jin'ichi Murakami
平成13年1月5日