次へ: 実験
上へ: 録音音声データの平均パワーの正規化の検討 1
戻る: 弱パワー区間を削除したときのパワー分布
以上3つの調査から、弱パワー区間を削除して正規化をすることにより
平均パワーが一定になることが予期される。そこで、フレームごとにパ
ワーを計算し、あまりにも小さい値や大きな値は削除して、平均値を求
めることでパワー正規化することを試みた。
本論文で提案するパワー正規化のアルゴリズムを以下に示す。
- ATRのDBから第2層のラベルを使用して母音ごとの標準平均パワー( )を計算する。
- 正規化する音声( )に対し連続音素認識を行ない、母音区間を推定する。
- 正規化する音声のフレームごとのパワー( )を計算する。
- 認識された母音区間を利用して、
フレームのパワー( )が標準平均パワー( )になるように、
フレーム正規化数 ( )を求める。
- フレーム正規化数 ( )が、あまりにも小さい値( )
あるいは大きな値( )の場合は削除して、平均値()を求める。
- 正規化する単語( )に対し平均値()の逆数を掛ける。
ATRのDBから第2層のラベルを使用して計算した各母音の標準平均パワーを
表2に示す。
表 2:
標準平均パワー
母音 |
標準平均パワー |
母音 |
標準平均パワー |
/a/ |
81076.7 |
/i/ |
65744.0 |
/u/ |
74762.6 |
/e/ |
81697.9 |
/o/ |
82552.1 |
|
|
平成15年9月30日