next up previous
次へ: 量子化歪みによる話者数の推定 上へ: 未知・複数話者クラスタリング実験 戻る: LBG法と変形LBG法との比較

話者数・単語数と識別率との関係

話者数と識別率との関係を、図3 (男女同数) 、図 4 (男性のみ) に示す。話者数が増加するに従い識別率が 下降する。男女の識別は比較的容易であるので同数の場合は男性のみの方がよ り識別が難しくなる。話者2人の発話の場合は男女の場合でも男性のみの場合 でも1単語の発話でほぼ完全に識別できる。10単語を用いる場合、尺度として KL Type2を適用すれば男女同数の場合でほぼ100%、男性のみの場合は8人で 約90%の識別率が得られる。特に話者8人の場合において、Euclid 距離では 単語数が増加しても識別率があまり上昇しないのに対し、KL情報量では識別率 が上昇する。これは単語数の増加に従い各ブロックの話者を表す出現確率のば らつきが小さくなり、KL情報量に基づいたクラスタリングが安定するためであ ると考えられる。逆に単語数が少ない場合はEuclid距離が最も良い識別性能を 与えている。

各ブロック (発話)中の単語数と識別率との関係を図 5 (話者4人の場合) 、図6 (話者8人の場合) に示す。単語数が増加するに従い識別率が上昇する。

話者8人の場合において、3種の尺度による識別率の関係は、音声長が5単語 より短い場合、Euclid $>$ KL Type1 $>$ KL Type2、音声長が5単語以上の場 合、Euclid $<$ KL Type1 $<$ KL Type2である。このことは、各ブロックの音 声長により尺度を使い分ける必要があることを示している。

図 3: 出現確率クラスタリング法における話者数と識別率との 関係 (男女同数)
\begin{figure}\begin{center}
\fbox{\epsfile{file=PS/RATEvsN-MF.ps,width=75mm}}\vspace{-4mm}
\end{center}\end{figure}

図 4: 出現確率クラスタリング法における話者数と識別率との 関係 (男性のみ)
\begin{figure}\vspace{-10mm}
\begin{center}
\fbox{\epsfile{file=PS/RATEvsN-MM.ps,width=75mm}}\vspace{-4mm}
\end{center}\end{figure}

図 5: 出現確率クラスタリング法における単語数と識別率との 関係 (話者4名)
\begin{figure}\vspace{-10mm}
\begin{center}
\fbox{\epsfile{file=PS/RATEvsWORDS-4.ps,width=75mm}}\vspace{-4mm}
\end{center}\vspace{-10mm}
\end{figure}

図 6: 出現確率クラスタリング法における単語数と識別率との 関係(話者8名)
\begin{figure}\begin{center}
\fbox{\epsfile{file=PS/RATEvsWORDS-8.ps,width=75mm}}\vspace{-4mm}
\end{center}\end{figure}

図 7: 最適量子化歪みと話者セットとの関係 M1F1, M2, M2F2, M4, M4F4, M8 (M:男, F:女, 5単語, 尺度:KL Type2)
\begin{figure}\vspace{-10mm}
\begin{center}
\fbox{\epsfile{file=PS/DST.hist.5w.KL2.ps,width=75mm}} \vspace{-4mm}
\end{center}\end{figure}



Jin'ichi Murakami 平成13年10月5日