次へ: HTKを用いた音節素片のモデル作成
上へ: 音響クラスタリング法
戻る: 音響クラスタリング法
目次
音響クラスタリング法の概要
従来研究において,音節波形接続型音声合成法に,言語情報とMFCCの距離尺度の
両方を用いた木に基づくクラスタリング(以下,クラスタリング[3])を
適用する手法が提案された[4,5].本研究では,上記の手法を
``音響クラスタリング法''と呼ぶ.図8に合成音声「財務
(za/i/mu)」を作成する場合の``音響クラスタリング法''における流れを示す.
また以下に図8の詳細な手順を示す,
- HTK[7]により,中心音節,前後音素環境,モーラ情報,アクセン
ト情報を考慮した音節素片のモデルを作成する.
- 手順1で作成した音節素片のモデルに対して,HTKにより言語情報とMFCCの
距離尺度の両方を用いたクラスタリングを行う.本研究では,クラスタリ
ングによって分割した音節素片の集団をクラスタと呼ぶ.クラスタの例を
表3 に示す.
表 3:
音響クラスタリング法におけるクラスタの例
|
- 作成する合成音声内の音節素片が含まれるクラスタを選択する.例えば,
合成音声「財務(za/i/mu)」を作成する場合,「財務(za/i/mu)」の
「za(pau-za0301011+i)」は,表3に示すza_2のクラス
タを選択する.
- 手順3で選択したクラスタ内の音節素片を,ランダムに1つ選択する.
- 手順4で選択した音節素片を含む音声を,ランダムに1つ選択する.
上記手順3,4,5を,作成する合成音声の各モーラ位置に対して行い,手順5で選択
した各音節素片を接続することで合成音声を作成する.
図 8:
音響クラスタリング法における合成音声作成の流れ
|
平成21年3月6日