next up previous contents
次へ: 実験条件 上へ: 評価実験 戻る: 混合HMMの作成条件   目次

学習データと評価データ

ATR単語発話データベースAset(1話者につき5,240単語)の男女各10 名の音声データを使用する. 評価データは,認識する話者の偶数番号データ(2,620単語)を使用する. 不特定話者に用いる学習データは,男女別に,認識する話者以外の9話 者の奇数番号データ(1話者につき2,620単語)を使用する. 話者適応に用いる学習データは,認識する話者の奇数番 号から,各音素の出現割合が評価データと同程度になるように選択した164単語 と82単語の2種類を用いる.

話者適応に用いる学習データ内に含まれる各音素の範囲別の種類数を 表7に示す.


表 1: 各範囲に含まれる音素の種類数
  0個 10個未満 10個以上 20個以上 30個以上 40個以上 合計
  (種)   20個未満 30個未満 40個未満   (種) n
164単語 6 8 9 0 3 8 34
82単語 6 15 6 2 1 4 34



平成20年3月11日