Next: モーラ情報とピッチ情報 Up: モーラ情報を用いた音素ラベリング方式の検討 Previous: モーラ情報を用いた音素ラベリング方式の検討

はじめに

音声認識・合成システムなどの音声情報処理システムの研究において、音素の境界位置を示す音素ラベリングデータは重要である。

現在、音素ラベリングデータは手作業で作成されており、多大な時間を必要としている。このような負担を軽減するため、大量の音声データを対象に、自動的に音素ラベリングを行うシステムが望まれている。しかしながら、現段階の自動音素ラベリングの精度は不十分であり、さらに高い精度が求められている。

ところで単語の音声を合成する際に、モーラ情報(モーラ位置、モーラ数)を考慮することで高い品質の合成音を作れることが知られている[1]。現在の自動音素ラベリングでは、特徴パラメータとしてケプストラム、メルケプストラムなどが使われているが、モーラ情報は通常使用されていない。そこで音素ラベリングにおいてもモーラ情報を考慮して、セグメンテーションを行うことで音素境界位置の精度は向上すると推定できる。

そこで本研究では、単語の母音を単語のモーラ数、モーラ位置で分類してHMMモデルの学習を行い、このHMMモデルを使ってセグメンテーションを行った場合の音素境界位置の精度を検討する。

2000-10-06