クラスタリングに際し各ブロックのカテゴリ特徴を表現する量の算出が重要 となる。話者識別への応用のために、本報告ではカテゴリ特徴量として Universal VQ 符号帳の符号の出現確率を用いる。他の方法として混合ガウス 分布も考えられる。これらは、既にテキスト独立型の話者認識や言語識別に対 して有力であることが報告されている [8,9]。
Universal 符号帳 ( は符号帳サイ ズ) は、 の全てのベクトルを用いてベクトル量子化することにより作成 される。入力信号系列の各ブロック はそれぞれ により量子化され、その量子化符号の出現頻度(出現確率)はサンプル ベクトル数がある程度多ければ各カテゴリ固有の特徴となり入力系列の各ブロッ クのカテゴリ性を表現する。出現確率 は次式で与えられる。
(1) |