next up previous
次へ: 実験 上へ: 録音音声データの平均パワーの正規化の検討 1 戻る: 弱パワー区間を削除したときのパワー分布

パワー正規化手法


以上3つの調査から、弱パワー区間を削除して正規化をすることにより 平均パワーが一定になることが予期される。そこで、フレームごとにパ ワーを計算し、あまりにも小さい値や大きな値は削除して、平均値を求 めることでパワー正規化することを試みた。

本論文で提案するパワー正規化のアルゴリズムを以下に示す。

  1. ATRのDBから第2層のラベルを使用して母音ごとの標準平均パワー( $ P_a $ )を計算する。

  2. 正規化する音声( $w $)に対し連続音素認識を行ない、母音区間を推定する。

  3. 正規化する音声のフレームごとのパワー( $ p_{ia} $)を計算する。

  4. 認識された母音区間を利用して、 フレームのパワー( $ p_{ia} $)が標準平均パワー( $ P_a $ )になるように、 フレーム正規化数 ( $T_{ia}$ )を求める。

  5. フレーム正規化数 ( $T_{ia}$ )が、あまりにも小さい値( $T_L$ ) あるいは大きな値( $T_B$ )の場合は削除して、平均値($T$)を求める。

  6. 正規化する単語( $w $)に対し平均値($T$)の逆数を掛ける。

ATRのDBから第2層のラベルを使用して計算した各母音の標準平均パワーを 表2に示す。




表 2: 標準平均パワー
母音 標準平均パワー 母音 標準平均パワー
/a/ 81076.7 /i/ 65744.0
/u/ 74762.6 /e/ 81697.9
/o/ 82552.1    





平成15年9月30日