next up previous
Next: ラベルファイルの母音分類 Up: モーラ情報を用いた音素ラベリング方式の検討 Previous: モーラ情報とピッチ情報

評価実験

本手法の有効性を調べるため、単語に対してモーラ情報を考慮した場合と考慮し ない場合についてセグメンテーションを行い、音素境界位置を計算する。 データベースには、ATRの単語発話データベースAset、5240単語を使用し、奇数番を学 習データ、偶数番を評価データとする。 学習データ、評価データともに音素数は約15500、母音数は約8000である。 また使用される音声データは全て、人手によって音素境界位置情報 が付与してある。評価実験はデータベースMAUとMMYの2話者でそれぞれ行う。 下の表1にその他の実験条件を示す。



 
 
Table 1: 実験条件
標本周波数 20kHz
分析窓 Hamming窓
分析窓長 20ms
フレーム周期 5ms
音響モデル 4状態3ループ(digonal)
mixture 3
特徴ベクトル 16次MFCC+
  対数パワー(計17次)




 


2000-10-06