next up previous
次へ: 尤度の変化 上へ: ergodic HMM による複数話者識別実験の結果 戻る: 通常の分析窓長のLPCケプストラムにおける実験結果

長時間窓LPCケプストラムによる実験結果

長時間窓(213ms)でLPCケプストラムを計算した場合の実験結果を 図5に示す。この図から次のことがわかる。

  1. $\mbox{\boldmath$B$}^{(0)}$をランダムにした時の実験(実験1)では、 学習回数が10回の場合、平均識別率は約30%と低いが、学習回数が 160回の時には75%近い平均識別率が得られた。この値は通常の分 析窓長による実験では35%であったことから、長時間分析は通常の ケプストラムより話者の特徴を良く表現しているパラメータである と予測される。

  2. 音声資料1セットごとの識別率を図6に載せた。 実験条件は長時間窓分析でViterbiアルゴリズムで状態遷 移を計算したものである。横軸は学習の繰り返しの回数で、縦軸は 識別率である。これから、学習回数が増加するにしたがい、平均の 識別率は上昇するが、同じ学習回数でも、音声資料ごとの識別率は 大きく変化していることがわかる。例えば、学習回数が160回のと き、平均識別率は約75.0%であるが、個々の識別率は57.5%から 92.1%と、大きな広がりを持つ。これは、初期パラメータによって 個々の音声資料の識別率が大きく変化するためと思われる。なお、 学習回数を1280回まで増加させた時、平均識別率は80.4%まで上昇 した。

  3. $\mbox{\boldmath$B$}^{(0)}$のみ真値にした時(実験2)、実験1 より、かなり高い平均識別率95%を得た。また、学習回数を重ねる ごとに平均識別率はすこしづつ上昇する。

  4. 初期パラメータの全てを真値にした実験(実験3)では、 学習回数を増加させても識別性能に全く変化がなく、約96% から97%であった。この値は、 $\mbox{\boldmath$B$}^{(0)}$に正しい値を与えて学習させ た時(実験2)の識別性能より僅かに高いが、差はほとんどない。 したがって、識別性能は特に初期パラメータの状態シンボル出力確 率の値に大きく依存すると考えられる。

  5. ViterbiアルゴリズムとForwardアルゴリズムでは、Forward アルゴリズムの方が、わずかに高い平均識別率を得るが、あまり差がな い。

図 5: 長時間窓分析によるLPCケプストラムを用いた時の学習回数と識別率との関係
\begin{figure}\begin{center}
\fbox{\epsfile{file=figure2.eps,width=75mm}} \end{center}\end{figure}

図 6: 音声資料別の識別率
\begin{figure}\begin{center}
\fbox{\epsfile{file=figure3.eps,width=75mm}} \end{center}\end{figure}



Jin'ichi Murakami 平成13年10月4日