next up previous
次へ: Universal 符号帳の作成手順 上へ: 実験の準備 戻る: 実験条件

識別評価方法

信号系列を複数のカテゴリに分類した場合、各カテゴリーがどの話者に対応 しているのかは同定できない。すなわち、求まる系列はカテゴリーの番号であ り、番号と話者の対応には $N!$ 個の組み合せが存在する。そのため以下の式 で識別率を算出した。

\begin{displaymath}
R = \frac{1}{K} \max_{\sigma} \sum_{k=1}^K
d (\tau(\mbox{\boldmath$X$}_k),\sigma(S_k))
\end{displaymath} (8)

ここで、 $\tau, \sigma, S_k, d$ はクラスター番号を与える写像、 $(1, 2,
\ldots, N)$ の任意の置換、各ブロックの正解カテゴリー番号、値が一致した 時のみ 1、それ以外は 0 である関数である。手順を表2 に示す。各カテゴリー番号を$\sigma$で置換し、$N!$ 通りの置換について正 解率を算出しその中の最大値を識別率とする。この例の場合、$3!=6$ 通りの 組み合せがあり識別率が $R=70\%$ となる。識別率 $R_{AVE}$は各試行の識別 率の10試行分を平均して算出される。$R$ の算出は出現確率による方法では上 式のようにブロック単位で、ergodic HMM の方法ではフレーム単位で行なわれ る。 ergodic HMM に対して $R$ の算出には多大の計算量を要するので分岐限 定法などの組み合せ最適化法による高速化が必要である。


表 2: 識別評価方法(話者3人・10系列の場合)
真の系列 1 1 1 2 2 2 3 3 3 3  
推定系列 1 1 0 0 2 0 0 2 2 2  
tex2html_wrap_inline$ ( arrayccc 1 2 3
0
1 2 ) $ 0 0 0 1 1 1 2
  $\times$ $\times$ tex2html_wrap_inline$$ $\times$ $\times$ $\times$ $\times$ tex2html_wrap_inline$$ tex2html_wrap_inline$$ tex2html_wrap_inline$$ = 40 %
tex2html_wrap_inline$ ( arrayccc 1 2 3
0
2 1 ) $ 0 0 0 2 2 2 1
  $\times$ $\times$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ $\times$ $\times$ $\times$ $\times$ $\times$ = 20 %
tex2html_wrap_inline$ ( arrayccc 1 2 3
1
0 2 ) $ 1 1 1 0 0 0 2
  tex2html_wrap_inline$$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ tex2html_wrap_inline$$ tex2html_wrap_inline$$ = 70 %
tex2html_wrap_inline$ ( arrayccc 1 2 3
1
2 0 ) $ 1 1 1 2 2 2 0
  tex2html_wrap_inline$$ tex2html_wrap_inline$$ $\times$ $\times$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ $\times$ $\times$ $\times$ = 40 %
tex2html_wrap_inline$ ( arrayccc 1 2 3
2
0 1 ) $ 2 2 2 0 0 0 1
  $\times$ $\times$ $\times$ tex2html_wrap_inline$$ $\times$ tex2html_wrap_inline$$ $\times$ $\times$ $\times$ $\times$ = 20 %
tex2html_wrap_inline$ ( arrayccc 1 2 3
2
1 0 ) $ 2 2 2 1 1 1 0
  $\times$ $\times$ $\times$ $\times$ $\times$ $\times$ tex2html_wrap_inline$$ $\times$ $\times$ $\times$ = 10 %
  $\Downarrow$
  最大値=70%
  =識別率


next up previous
次へ: Universal 符号帳の作成手順 上へ: 実験の準備 戻る: 実験条件
Jin'ichi Murakami 平成13年10月5日