next up previous
Next: モーラ情報とピッチ情報 Up: モーラ情報を用いた音素ラベリング方式の検討 Previous: モーラ情報を用いた音素ラベリング方式の検討

はじめに

音声認識・合成システムなどの音声情報処理システムの研究において、音素の境 界位置を示す音素ラベリングデータは重要である。

現在、音素ラベリングデータは手作業で作成されており、 多大な時間を必要としている。このような負担を軽減するため、大量の音声デー タを対象に、自動的に音素ラベリングを行うシステムが望まれている。しかしな がら、現段階の自動音素ラベリングの精度は不十分であり、さらに高い精度が求 められている。

ところで単語の音声を合成する際に、モーラ情報(モーラ位置、モーラ数)を考慮 することで高い品質の合成音を作れることが知られている[1]。 現在の自動音素ラベリングでは、特徴パラメータとしてケプストラム、メルケプスト ラムなどが使われているが、モーラ情報は通常使 用されていない。そこで音素ラベリングにおいても モーラ情報を考慮して、セグメンテーションを行うことで音素境界位置の精度は 向上すると推定できる。

そこで本研究では、単語の母音を単語のモーラ数、モーラ位置 で分類してHMMモデルの学習を行い、このHMMモデルを使ってセグメンテーション を行った場合の音素境界位置の精度を検討する。





2000-10-06