実験結果

次へ: 考察 上へ: 単語のHMMとbigramを利用した文節音声認識 戻る: 文節音声認識実験目次

文節認識の実験結果を表4.4に示す。この結果から得られたことを以下に示す。

実験1からtest-closed の正常所見で96.8%、異常所見では78.1%、text-open dataの正常所見でも86.5%、異常所見では72.1%の高い文節認識率が得られた。したがってHMMの学習データが１つでもFuzzy-VQを使用することにより高い文節認識性能が得られることがわかった。
実験1と実験2の比較から、duration controlを行なうと認識性能が低下した。この原因としてduration controlに使用した平均・分散の値の不正確さが考えられる。これらの値は同一話者が発声した３つの単語発声の音声データから計算したため値の信頼度はかなり低い。
実験結果2と実験結果3の比較から、N-bestの幅を広げた方が高い認識率を出すことが示された。
実験結果2と実験結果4の比較から、音声データを増加させることによって認識性能が向上することが示された。これはHMMのパラメータを推定するための学習データが１つでは、不十分であることを示している。しかし不特定話者認識の場合、一人の発話データが１つしかなくても、複数の話者が発話することによって、多くの音声データが利用できるため、認識単位が単語でも問題はないと思われる。

Jin'ichi Murakami 平成13年1月5日