next up previous
次へ: ランダムテキストの効果 上へ: 未知・複数話者クラスタリング実験 戻る: 無音区間を除去する効果

Fuzzy VQ の効果

出現確率の算出に Fuzzy VQ を適用する。これは式(9)に 示すように入力ベクトル $x_t$ に対する Fuzzy membership 関数 $w_{tl}$ から算出される。式中で $N_k$$x_t$ $\mbox{\boldmath$U$}$$k$ 近傍の符号番号の集合である。 fuzziness ($F$) と $k$ 近傍数とを変化させた時の識別率を図 15に示す。話者は男性8名で KL Type 2 を 用いており、無音区間を除いている。Hard VQ の時、81.8% の識別率が $F=1.1, k=2$ の時、 85.3% に向上している。一方、近傍数が増加するにつ れて逆に劣化している。この傾向は他の話者組み合せに対しても同様である。 話者数が少ない場合のように問題が簡単なほどこの傾向が顕著であり、さらに Fuzzy VQ の効果が大きい。


\begin{displaymath}
p_l = \frac{K_l}{M}, \ \
K_l = \sum_t w_{tl},
\end{displaymath} (9)


\begin{displaymath}%% \displaystyle
w_{tl} = \left\{ \begin{array}{ll}
1/(\dis...
...
& l \in N_k, \\
0 & \mbox{otherwise.}
\end{array} \right.
\end{displaymath} (10)

図 15: Fuzzy VQ と Hard VQ との比較 (話者8人)
\begin{figure}\vspace{-5mm}
\begin{center}
\fbox{\epsfile{file=PS/RATE_HARDvsFUZZY-M8s.ps,width=75mm}} \vspace{-4mm}
\end{center}\end{figure}



Jin'ichi Murakami 平成13年10月5日