next up previous
Next: 評価実験 Up: モーラ情報を用いた音素ラベリング方式の検討 Previous: はじめに

モーラ情報とピッチ情報

特定話者の単語の発声において、単語のモーラ数、モーラ位置が決まればピッ チ周波数がほぼ決まることが知られている[1]。 図1は[1]から引用したもので、単一話者が発声した5モーラ語 2,800件のピッチ周波数の平均値と分散を示している。 また時間軸はモーラ数で正規化してある。



  
Figure 1: 5モーラ語2,800件のピッチ周波数平均値と分散
\includegraphics[scale=0.8,clip]{test.eps}

この図より、単語によらずピッチ周波数の分散は小さく、ピッチ 周波数は単語のモーラ数、モーラ位置でほぼ同一であることがわかる。 4、6モーラ語も同様の傾向を示し、分散も5モーラ語 と同程度であったと報告されている。 このことから、単語の母音を単語のモーラ数、モーラ位置 で分類して、HMMモデルの学習を行い、このHMMモデルを使ってセグメンテー ションを行った場合、音素境界位置の精度は向上すると推定できる。





2000-10-06