次へ: 尤度の変化
上へ: ergodic HMM による複数話者識別実験の結果
戻る: 通常の分析窓長のLPCケプストラムにおける実験結果
長時間窓(213ms)でLPCケプストラムを計算した場合の実験結果を
図5に示す。この図から次のことがわかる。
-
をランダムにした時の実験(実験1)では、
学習回数が10回の場合、平均識別率は約30%と低いが、学習回数が
160回の時には75%近い平均識別率が得られた。この値は通常の分
析窓長による実験では35%であったことから、長時間分析は通常の
ケプストラムより話者の特徴を良く表現しているパラメータである
と予測される。
- 音声資料1セットごとの識別率を図6に載せた。
実験条件は長時間窓分析でViterbiアルゴリズムで状態遷
移を計算したものである。横軸は学習の繰り返しの回数で、縦軸は
識別率である。これから、学習回数が増加するにしたがい、平均の
識別率は上昇するが、同じ学習回数でも、音声資料ごとの識別率は
大きく変化していることがわかる。例えば、学習回数が160回のと
き、平均識別率は約75.0%であるが、個々の識別率は57.5%から
92.1%と、大きな広がりを持つ。これは、初期パラメータによって
個々の音声資料の識別率が大きく変化するためと思われる。なお、
学習回数を1280回まで増加させた時、平均識別率は80.4%まで上昇
した。
-
のみ真値にした時(実験2)、実験1
より、かなり高い平均識別率95%を得た。また、学習回数を重ねる
ごとに平均識別率はすこしづつ上昇する。
- 初期パラメータの全てを真値にした実験(実験3)では、
学習回数を増加させても識別性能に全く変化がなく、約96%
から97%であった。この値は、
に正しい値を与えて学習させ
た時(実験2)の識別性能より僅かに高いが、差はほとんどない。
したがって、識別性能は特に初期パラメータの状態シンボル出力確
率の値に大きく依存すると考えられる。
- ViterbiアルゴリズムとForwardアルゴリズムでは、Forward
アルゴリズムの方が、わずかに高い平均識別率を得るが、あまり差がな
い。
図 5:
長時間窓分析によるLPCケプストラムを用いた時の学習回数と識別率との関係
|
図 6:
音声資料別の識別率
|
Jin'ichi Murakami
平成13年10月4日