次元ベクトル を 個のカテゴリにクラスタ リングするために LBG 法[10]を用いる。通常の LBG 法では、 分割の個数が 2 の巾乗となり、任意カテゴリ数のクラスタリングを考える本 問題には適していない。また2分割を行なうため比較的歪みの小さい集合 (partition) までも分割してしまう危険性を持っている。そこで本報告では歪 み最大の集合のみを分割する変形 LBG 法を用いる[11]。こ れにより、2 の巾乗以外のカテゴリ数の場合でもクラスタリングが可能となり、 かつ歪みの小さい集合が分割されることがなくなる。LBG法と変形LBG法の比較 実験を4.1で述べる。
クラスタリングにおける出現確率間の距離尺度としてここでは次式で表され る Euclid 距離及び二つのタイプの Kullback-Leibler (KL) 情報量を用いる。
(5) |
(6) |