次へ: 実験
上へ: 録音音声データの平均パワーの正規化の検討 1
戻る: 弱パワー区間を削除したときのパワー分布
以上3つの調査から、弱パワー区間を削除して正規化をすることにより
平均パワーが一定になることが予期される。そこで、フレームごとにパ
ワーを計算し、あまりにも小さい値や大きな値は削除して、平均値を求
めることでパワー正規化することを試みた。
本論文で提案するパワー正規化のアルゴリズムを以下に示す。
- ATRのDBから第2層のラベルを使用して母音ごとの標準平均パワー(
)を計算する。
- 正規化する音声(
)に対し連続音素認識を行ない、母音区間を推定する。
- 正規化する音声のフレームごとのパワー(
)を計算する。
- 認識された母音区間を利用して、
フレームのパワー(
)が標準平均パワー(
)になるように、
フレーム正規化数 (
)を求める。
- フレーム正規化数 (
)が、あまりにも小さい値(
)
あるいは大きな値(
)の場合は削除して、平均値(
)を求める。
- 正規化する単語(
)に対し平均値(
)の逆数を掛ける。
ATRのDBから第2層のラベルを使用して計算した各母音の標準平均パワーを
表2に示す。
表 2:
標準平均パワー
母音 |
標準平均パワー |
母音 |
標準平均パワー |
/a/ |
81076.7 |
/i/ |
65744.0 |
/u/ |
74762.6 |
/e/ |
81697.9 |
/o/ |
82552.1 |
|
|
平成15年9月30日