現在、音素ラベリングデータは手作業で作成されており、 多大な時間を必要としている。このような負担を軽減するため、大量の音声デー タを対象に、自動的に音素ラベリングを行うシステムが望まれている。しかしな がら、現段階の自動音素ラベリングの精度は不十分であり、さらに高い精度が求 められている。
ところで単語の音声を合成する際に、モーラ情報(モーラ位置、モーラ数)を考慮 することで高い品質の合成音を作れることが知られている[1]。 現在の自動音素ラベリングでは、特徴パラメータとしてケプストラム、メルケプスト ラムなどが使われているが、モーラ情報は通常使 用されていない。そこで音素ラベリングにおいても モーラ情報を考慮して、セグメンテーションを行うことで音素境界位置の精度は 向上すると推定できる。
そこで本研究では、単語の母音を単語のモーラ数、モーラ位置 で分類してHMMモデルの学習を行い、このHMMモデルを使ってセグメンテーション を行った場合の音素境界位置の精度を検討する。