Next: 評価実験
Up: モーラ情報を用いた音素ラベリング方式の検討
Previous: はじめに
特定話者の単語の発声において、単語のモーラ数、モーラ位置が決まればピッ
チ周波数がほぼ決まることが知られている[1]。
図1は[1]から引用したもので、単一話者が発声した5モーラ語
2,800件のピッチ周波数の平均値と分散を示している。
また時間軸はモーラ数で正規化してある。
Figure 1:
5モーラ語2,800件のピッチ周波数平均値と分散
|
この図より、単語によらずピッチ周波数の分散は小さく、ピッチ
周波数は単語のモーラ数、モーラ位置でほぼ同一であることがわかる。
4、6モーラ語も同様の傾向を示し、分散も5モーラ語
と同程度であったと報告されている。
このことから、単語の母音を単語のモーラ数、モーラ位置
で分類して、HMMモデルの学習を行い、このHMMモデルを使ってセグメンテー
ションを行った場合、音素境界位置の精度は向上すると推定できる。
2000-10-06