次へ: 実験結果
上へ: 音素数に偏りを持つ学習データ
戻る: 音素数に偏りを持つ学習データ
目次
偏りを持つ学習データは,評価データ内の音素の出現率が2%未満の子音を含む
単語を,2%以上の子音を含む単語に選択し直して作成する.
通常の学習データと同様に164単語の学習データ,82単語の学習データを作成する.
図10に評価データと通常の164単語の学習データと音素数に
偏りを持つ164単語の学習データの音素の出現率を降順にソートした分布を,
図11に評価データと通常82単語の学習データと音素数に
偏りを持つ82単語の学習データの音素の出現率を降順にソートした分布を示す.
図 10:
164単語の学習データ内の音素の出現率
|
- 2%以下の分布
この範囲に分布されている音素は,音素数の少ない子音である.音素数に
偏りを持つ学習データ内にはほぼ存在しない分布となる.
- 2%〜8%の分布
この範囲に分布されている音素は,音素数の多い子音とである.この範囲で
は常に偏りを持つ学習データがの出現率が多い.
- 8%以上の分布
この範囲に分布されている音素は,母音である.母音は条件を付けていないた
め,2つの学習データの共に評価データとほぼ同じ分布となる.
作成した音素数に偏りを持つ学習データ内に含まれる各音素の範囲別の種類数を
表7に示す.
表 7:
各範囲に含まれる音素の種類数
|
0個 |
10個未満 |
10個以上 |
20個以上 |
30個以上 |
40個以上 |
合計 |
|
(種) |
|
20個未満 |
30個未満 |
40個未満 |
|
(種) n |
164単語 |
18 |
1 |
1 |
0 |
4 |
10 |
34 |
82単語 |
19 |
1 |
4 |
4 |
1 |
5 |
34 |
平成20年3月11日