Next: 実験手順
Up: No Title
Previous: ピッチ情報とモーラ情報の関係
評価実験
本手法の有効性を調べるため、モーラ情報を使用した場合と使用しない場合につ
いて、音素ラベリングを行った。
実験条件を表6に示す。
音素ラベリングを行うツールとして、HTK[2]を使用した。
実験には、ATRのAset単語発話データベース(5240単語)を使用した。このデータベー
スに含まれる波形データには、全て人手によって音素境界位置情報を付与してあ
る、ハンドラベル付の音声ラベルデータが対になっている。このデータベー
スを偶数番と奇数番に分け、偶数を
学習データ、奇数を評価データとして使用した。2つのデータベース(話者A、話
者B)を使いそれぞれ実験を行った。
Table 6:
実験条件
標本周波数 |
20kHz |
学習DB |
2620単語 |
分析窓 |
Hamming窓 |
音素数 |
約15500 |
分析窓長 |
20ms |
母音数 |
約8000 |
フレーム周期 |
5ms |
|
|
音響モデル |
4状態3ループ |
評価DB |
2620単語 |
特徴ベクトル |
16次MFCC+ |
音素数 |
約15500 |
|
対数パワー(計17次) |
母音数 |
約8000 |
maeta tomohiro
2000-03-16