next up previous contents
次へ: 実験結果 上へ: 音素数に偏りを持つ学習データ 戻る: 音素数に偏りを持つ学習データ   目次

音素数に偏りを持つ学習データの作成

偏りを持つ学習データは,評価データ内の音素の出現率が2%未満の子音を含む 単語を,2%以上の子音を含む単語に選択し直して作成する. 通常の学習データと同様に164単語の学習データ,82単語の学習データを作成する.

10に評価データと通常の164単語の学習データと音素数に 偏りを持つ164単語の学習データの音素の出現率を降順にソートした分布を, 図11に評価データと通常82単語の学習データと音素数に 偏りを持つ82単語の学習データの音素の出現率を降順にソートした分布を示す.

図 10: 164単語の学習データ内の音素の出現率
\fbox{
\includegraphics[scale=0.35]{eps/onso_164.eps}
}


図 11: 82単語の学習データ内の音素の出現率
\fbox{
\includegraphics[scale=0.35]{eps/onso_82.eps}
}

作成した音素数に偏りを持つ学習データ内に含まれる各音素の範囲別の種類数を 表7に示す.


表 7: 各範囲に含まれる音素の種類数
  0個 10個未満 10個以上 20個以上 30個以上 40個以上 合計
  (種)   20個未満 30個未満 40個未満   (種) n
164単語 18 1 1 0 4 10 34
82単語 19 1 4 4 1 5 34



平成20年3月11日