next up previous
次へ: むすび 上へ: 未知・複数話者クラスタリング実験 戻る: Fuzzy VQ の効果

ランダムテキストの効果

以上の実験でのテキスト(単語集合)は同一話者内では全て異なるが全話者 共通となっている。各話者が同一テキスト発話であるのでテキスト固定型と言 える。この場合、共通のテキストを用いるので話者の違いが強調されより識別 がしやすくなると考えられる。そこでランダムテキストすなわち単語がランダ ムに並ぶ時の識別性能を評価する。ここでは乱数を用いて単語列を作成した。 結果を図16に示す。ここでは前節の 結果から Fuzzy VQ を適用している。入力単語が少ない場合はテキスト固定と ランダムテキストとの性能の差は小さいが単語数が増加するにつれてランダム テキストの方がはるかに高い識別率を与えることがわかる。これは予想に反す る結果であるが、テキスト固定の場合、使われる単語列が50音順に並んでお り入力中の音素が偏って分布し話者特徴量である出現確率が良好に推定されな いためと考えられる。実際の対話音声では全ての音素が偏らずにランダムに含 むことは強い仮定であるので、これほど高い性能は得られないと考えられる。

図 16: ランダムテキストの時の単語数と識別率との 関係 (男性話者8人)
\begin{figure}\vspace{-5mm}
\begin{center}
\fbox{\epsfile{file=PS/RATE_HARDvsFUZZY_Random-M8.ps,width=75mm}} \vspace{-4mm}
\end{center}\end{figure}



Jin'ichi Murakami 平成13年10月5日