音響クラスタリング法の概要

次へ: HTKを用いた音節素片のモデル作成 上へ: 音響クラスタリング法 戻る: 音響クラスタリング法目次

音響クラスタリング法の概要

従来研究において，音節波形接続型音声合成法に，言語情報とMFCCの距離尺度の両方を用いた木に基づくクラスタリング（以下，クラスタリング[3]）を適用する手法が提案された[4,5]．本研究では，上記の手法を ``音響クラスタリング法''と呼ぶ．図8に合成音声「財務 (za/i/mu)」を作成する場合の``音響クラスタリング法''における流れを示す．また以下に図8の詳細な手順を示す，

HTK[7]により，中心音節，前後音素環境，モーラ情報，アクセント情報を考慮した音節素片のモデルを作成する．
手順1で作成した音節素片のモデルに対して，HTKにより言語情報とMFCCの距離尺度の両方を用いたクラスタリングを行う．本研究では，クラスタリングによって分割した音節素片の集団をクラスタと呼ぶ．クラスタの例を表3 に示す．

表 3: 音響クラスタリング法におけるクラスタの例

$\scalebox{1}{ \begin{tabular}[htb]{\vert c\vert c\vert c\vert} \hline クラスタ名... ...i-sa0302001+k & pau-za0301011+i \\ & & pau-za0401011+i \\ \hline \end{tabular}}$
作成する合成音声内の音節素片が含まれるクラスタを選択する．例えば，合成音声「財務(za/i/mu)」を作成する場合，「財務(za/i/mu)」の「za(pau-za0301011+i)」は，表3に示すza_2のクラスタを選択する．
手順3で選択したクラスタ内の音節素片を，ランダムに1つ選択する．
手順4で選択した音節素片を含む音声を，ランダムに1つ選択する．

**表 3:** 音響クラスタリング法におけるクラスタの例
$\scalebox{1}{ \begin{tabular}[htb]{\vert c\vert c\vert c\vert} \hline クラスタ名... ...i-sa0302001+k & pau-za0301011+i \\ & & pau-za0401011+i \\ \hline \end{tabular}}$

上記手順3,4,5を，作成する合成音声の各モーラ位置に対して行い，手順5で選択した各音節素片を接続することで合成音声を作成する．

**図 8:** 音響クラスタリング法における合成音声作成の流れ
$\includegraphics[width=15cm]{onkyo_float.eps}$

平成21年3月6日