Next: ラベルファイルの母音分類
Up: モーラ情報を用いた音素ラベリング方式の検討
Previous: モーラ情報とピッチ情報
本手法の有効性を調べるため、単語に対してモーラ情報を考慮した場合と考慮し
ない場合についてセグメンテーションを行い、音素境界位置を計算する。
データベースには、ATRの単語発話データベースAset、5240単語を使用し、奇数番を学
習データ、偶数番を評価データとする。
学習データ、評価データともに音素数は約15500、母音数は約8000である。
また使用される音声データは全て、人手によって音素境界位置情報
が付与してある。評価実験はデータベースMAUとMMYの2話者でそれぞれ行う。
下の表1にその他の実験条件を示す。
Table 1:
実験条件
標本周波数 |
20kHz |
分析窓 |
Hamming窓 |
分析窓長 |
20ms |
フレーム周期 |
5ms |
音響モデル |
4状態3ループ(digonal) |
mixture |
3 |
特徴ベクトル |
16次MFCC+ |
|
対数パワー(計17次) |
2000-10-06