next up previous contents
次へ: 話者特徴量と長時間窓分析 上へ: Ergodic HMM による複数話者発話の識別の実験結果 戻る: Ergodic HMM による複数話者発話の識別の実験結果   目次

基本手法の実験結果

LPCケプストラムを分析窓長21.3msで計算した時の実験結果を図 8.4に示す。平均識別率は、実験1、2に関 しては8セットの音声資料の平均値で、実験3に関しては、 8セッ トの音声資料それぞれに対し 16回の異なる初期モデルで実験し た、合計128回の平均値である。この図において、縦軸が平均識 別率で横軸がHMMの学習回数である。□は実験1の、△は実験2 の、○は実験3の結果である。また、実線で■▲●はViterbi 復 号法による平均識別率で、破線で□△○はforward アルゴリズムによる平均識 別率である。この図からわかることを以下に示す。

図 8.4: 学習回数と平均識別率の関係
\begin{figure}\begin{center}
\fbox{\epsfile{file=PS/figure1.ps,width=10cm}} \end{center}\end{figure}

  1. Viterbi アルゴリズムと forward アルゴリズムの平均識別率の差は 小さい。しかし、パラメータの全てを真値にした実験(実験1) では、forward アルゴリズムでは94.0% であったのに対し、Viterbi アルゴリズムでは48.3%しか 得られな かった。この原因としてViterbi アルゴリズムは誤った経路を選択した場合、 最後まで経路を間違えてしま うのに対し、 forward アルゴリズムは間違った経路を選択しても、その 後正しい経路を選択する可能性があるためと考えている。

  2. シンボル出力確率 $\mbox{\boldmath$B$}^{(0)}$のみ真値にした実験(実験2)では 平均識別率約 75%が得られた。しかし、学習回数を繰り返すに 従い、平均識別率は低下した。また $\mbox{\boldmath$B$}^{(0)}$をランダムにし た実験(実験3)では平均識別率で 30%から35%と低い値になっ た。この値は学習回数を増加してもあまり向上しない。この原因 として、今回の実験は音素認識で使用される分析条件で実験を行 なったため、パラメータは主に音素のカテゴリを特徴づけるパラ メータになっていて、話者を特徴づけるパラメータになっていな いためと考えている。



Jin'ichi Murakami 平成13年1月5日