next up previous
次へ: ergodic HMM による複数話者識別実験の結果 上へ: 複数話者識別実験の実験条件 戻る: Universal 符号帳の作成手順

識別評価方法

信号信号系列をergodic HMMによって複数のカテゴリに分類しても、 各カテゴリーがどの話者に対応しているのかは同定できない。すな わち、求まる系列はカテゴリーの番号であり、番号と話者の対応に は $N!$ 個の組み合せが存在する。そのため以下の式で識別率を算 出した。

\begin{displaymath}
R = \frac{1}{K} \max_{\sigma} \sum_{k=1}^K
d (\tau(\mbox{\boldmath$X$}_k),\sigma(S_k))
\end{displaymath} (1)

ここで、 $\tau, \sigma, S_k, d$ はクラスター番号を与える写像、 $(1, 2,\ldots, N)$ の任意の置換、各ブロックの正解カテゴリー 番号、値が一致した時のみ 1、それ以外は 0 である関数である。 ここでは、各カテゴリー番号を$\sigma$で置換し、$N!$ 通りの置 換について正解率を算出しその中の最大値を識別率とした。なお、 話者が4人の場合では$4!=24$ 通りの組み合せがある。平均識別率 $R_{AVE}$は各試行の識別率の10試行分を平均して算出される。$R$ の算出はフレーム単位で行なわれる。 なお、$N$が大きくなる時 $R$ の算出に多大の計算量を要するため、分岐限定法などの組み合 せ最適化法による高速化が必要である。



Jin'ichi Murakami 平成13年10月4日