next up previous
次へ: 出現確率クラスタリング法 上へ: 問題の定式化 戻る: 問題の定式化

出現確率によるカテゴリ特徴付け

クラスタリングに際し各ブロックのカテゴリ特徴を表現する量の算出が重要 となる。話者識別への応用のために、本報告ではカテゴリ特徴量として Universal VQ 符号帳の符号の出現確率を用いる。他の方法として混合ガウス 分布も考えられる。これらは、既にテキスト独立型の話者認識や言語識別に対 して有力であることが報告されている [8,9]。

Universal 符号帳 $\mbox{\boldmath$U$}= \{ \mbox{\boldmath$u$}_l \} (l=1,2,...,L)$ ($L$ は符号帳サイ ズ) は、 $\mbox{\boldmath$X$}$ の全てのベクトルを用いてベクトル量子化することにより作成 される。入力信号系列の各ブロック $\mbox{\boldmath$X$}_k$ $(k=1,2,...,K)$ はそれぞれ $\mbox{\boldmath$U$}$ により量子化され、その量子化符号の出現頻度(出現確率)はサンプル ベクトル数がある程度多ければ各カテゴリ固有の特徴となり入力系列の各ブロッ クのカテゴリ性を表現する。出現確率 $\mbox{\boldmath$p$}_k$ は次式で与えられる。


\begin{displaymath}
\mbox{\boldmath$p$}_k = ( p_{k1} p_{k2} ... p_{kL}), \ \
p_{kl} = \frac{K_{kl}}{M_k},
\end{displaymath} (1)

ここで、$K_{kl}$$k$ 番目のブロックに対する符号 $l$ の出現頻度、 $M_k$$k$ 番目のブロックの継続長であり、 $\mbox{\boldmath$p$}_k$$L$ 次元ベクトル となる。



Jin'ichi Murakami 平成13年10月5日