next up previous
次へ: 文献目録 上へ: tecrep_h 戻る: 3モーラ以上の単語の改善


結論


本研究では、単語のモーラ数・モーラ位置で母音を分類して、 モーラ情報を考慮したモデルの学習を行い、そのモデルとモーラ情報を使用して いない通常のモデルを使ってそれぞれ単語音声認識を行った。

Diagonal-covarianceのHMMを用いた単語音声認識の結果では、男性話者では平均0.81%、女性話者 では平均0.63%、データベース全体では0.72%の誤り率の減少が見られた。 またそれぞれ改善率は、男性話者では15.69%、女性話者では11.33%、データベー ス全体では13.44%であった。

Full-covarianceのHMMを用いた単語音声認識の結果も Diagonal-covarianceのHMMを用いた単語音声認識の結果と同様の傾向が見られ、 Diagonal-covarianceよりもさらに1%近く高い認識率になった。

以上の結果から、モーラ情報を考慮することによって、多くの話者に対し単語音 声認識の誤り率を減少させることができ、本手法の有効性が認められた。

今後の課題としては、 モーラ情報が有効に作用する 分析パラメータの最適な実験条件を見つける必要がある。 前後の音素を考慮したbi-phoneやtri-phoneモデルを用いた単語音声認識、 不特定話者認識および雑音下における単語音声認識に 対してモーラ情報を考慮し、その有効性を確認することも必要である。



平成14年4月24日