next up previous contents
次へ: 言語情報の条件の緩和 上へ: 言語情報とMFCCの距離尺度の両方を用いたクラスタリング 戻る: 言語情報とMFCCの距離尺度の両方を用いたクラスタリング   目次

言語情報とMFCCの距離尺度の両方を用いたクラスタリングの概 要

音響クラスタリング法は,音節波形接続型音声合成法に,言語情報とMFCCの距離 尺度の両方を用いたクラスタリング適用する手法である.言語情報とMFCCの距離 尺度の両方を用いたクラスタリング(3.1節の手順2)は,HTKによ り作成した音節モデルに対して,HTKおよび言語情報に関する``質問''を用いて 行う.クラスタリングの手順を以下に示す.また質問の例を表4に 示す.

  1. 初期状態として,全ての音節モデルをルートノードにまとめる.

  2. 1に対して,$ log$ 尤度が最大になるような質問を用いて,親ノードの音節 モデルを分割する.

  3. 全ての音節モデルを共有したときの$ log$ 尤度と,音節モデルを分割した ときの$ log$ 尤度を比較する.

  4. 3において,$ log$ 尤度の増加が閾値を下回れば決定木の構築を終え,下回ら なければ状態の分割を繰り返す.構築した決定木を図11に 示す.

  5. 最終的な状態数が1000となるように分割する.


表 4: クラスタリングの質問の例
質問名 質問の内容 捕捉説明
R_g2 *+g,*+gy 後音素環境はg,gyのどちらか?
L_Voiced-Stop6 b-*,d-*,g-*,gy-* 前音素環境はb,d,g,gyのどれか?
L_hh h-* 前音素環境はhか,それ以外か?
AC15 *-*010+*,*-*011+* アクセント型は01でかつ高いか?低いか?

図 11: 構築した決定木の例
\includegraphics[width=15cm]{tree.eps}



平成21年3月6日