next up previous
次へ: 実験の準備 上へ: 問題の定式化 戻る: 出現確率クラスタリング法

カテゴリ数 $(N)$ の推定

出現確率クラスタリング法では、クラスタリングの分割全体の平均歪み $D$ が計算される。

\begin{displaymath}
D = \frac{1}{K} \sum_{k=1}^K \mathop{\rm min}_l d(\mbox{\boldmath$p$}_k,\mbox{\boldmath$z$}_l)
\end{displaymath} (7)

分割の個数が真のカテゴリ数と等しい場合における $D$ の値が、カテゴリー 数(話者数)やカテゴリーの種類(性別)などによらず変化しないならば、$D$の 絶対的な値を基に $N$ を推定できることになる。これについては 4.3で考察する。

ergodic HMM の場合、Baum-Welchのパラメータ推定アルゴリズムにおいて、 シンボル系列に対するモデルの尤度が計算される。出現確率による解法と同様、 尤度の絶対的な値を基に$N$を推定できると考えられる。また、$N$ の推定値 を客観的に与える方法として、AIC基準やMDL基準等の情報量基準の適用も考え られる[13,14]。



Jin'ichi Murakami 平成13年10月5日