next up previous contents
次へ: HTKを用いた音節素片のモデル作成 上へ: 音響クラスタリング法 戻る: 音響クラスタリング法   目次


音響クラスタリング法の概要

従来研究において,音節波形接続型音声合成法に,言語情報とMFCCの距離尺度の 両方を用いた木に基づくクラスタリング(以下,クラスタリング[3])を 適用する手法が提案された[4,5].本研究では,上記の手法を ``音響クラスタリング法''と呼ぶ.図8に合成音声「財務 (za/i/mu)」を作成する場合の``音響クラスタリング法''における流れを示す. また以下に図8の詳細な手順を示す,

  1. HTK[7]により,中心音節,前後音素環境,モーラ情報,アクセン ト情報を考慮した音節素片のモデルを作成する.

  2. 手順1で作成した音節素片のモデルに対して,HTKにより言語情報とMFCCの 距離尺度の両方を用いたクラスタリングを行う.本研究では,クラスタリ ングによって分割した音節素片の集団をクラスタと呼ぶ.クラスタの例を 表3 に示す.


    表 3: 音響クラスタリング法におけるクラスタの例
    \scalebox{1}{
\begin{tabular}[htb]{\vert c\vert c\vert c\vert} \hline
クラスタ名...
...i-sa0302001+k & pau-za0301011+i \\
& & pau-za0401011+i \\ \hline
\end{tabular}}


  3. 作成する合成音声内の音節素片が含まれるクラスタを選択する.例えば, 合成音声「財務(za/i/mu)」を作成する場合,「財務(za/i/mu)」の 「za(pau-za0301011+i)」は,表3に示すza_2のクラス タを選択する.

  4. 手順3で選択したクラスタ内の音節素片を,ランダムに1つ選択する.

  5. 手順4で選択した音節素片を含む音声を,ランダムに1つ選択する.

上記手順3,4,5を,作成する合成音声の各モーラ位置に対して行い,手順5で選択 した各音節素片を接続することで合成音声を作成する.

図 8: 音響クラスタリング法における合成音声作成の流れ
\includegraphics[width=15cm]{onkyo_float.eps}



平成21年3月6日