言語クラスタリング法の概要

次へ: 言語クラスタリング法におけるルール 上へ: 言語クラスタリング法 戻る: 言語クラスタリング法目次

言語クラスタリング法の概要

従来研究である音響クラスタリング法において，言語情報の条件を緩和することで，理論上全ての音声が作成可能であると示された．しかし，音声品質の非常に悪い音声が生成されてしまう場合がある．その原因の1つとしてMFCCの距離尺度が，音声品質に悪影響を与える可能性があると考えられる．

そこで本研究では，MFCCの距離尺度の代わりに，言語情報と人間の聴覚的な知識（ルール）を用いて木に基づくクラスタリングを行い，音節波形接続型音声合成法に適用する．本研究では上記の手法を``言語クラスタリング法''と呼ぶ．図 17に合成音声「財務(za/i/mu)」を作成する場合の``言語クラスタリング法''における流れを示す．また以下に図17の詳細な手順を示す，

データベース中の音節素片8,138個をポーズ(``pau'')の位置に基づいて，始端音節，中間音節，終端音節の3つのグループに分類する．
手順1の3つのグループと，作成する音声のラベルを入力データとして準備する．
手順2で示す入力データを，上位のルールから順に照合し，適合した音節素片が1つ以上存在するクラスタが得られた時点で，照合を停止する．

ルールより得られたクラスタ内の音節素片を，ランダムに1つ選択する．クラスタの例を表6 に示す．

**表 6:** 言語クラスタリング法におけるクラスタの例
クラスタ名	N_5	za_3
	a-N0202001+pau	pau-za0201011+i
クラスタ内の	a-N0303001+pau	pau-za0401011+i
音節素片	o-N0303001+pau	pau-za0501011+i
	u-N0202001+pau	pau-za0601011+i
	u-N0303001+pau

手順4で選択した音節素片を含む音声の中で，最も継続時間の長い音声を選択する．

上記手順3,4,5を，作成する合成音声の各モーラ位置に対して行い，手順5で選択した各音節素片を接続することで合成音声を作成する．

**図 17:** 言語クラスタリング法における合成音声作成の流れ
$\includegraphics[width=15cm]{last_exp.eps}$

平成21年3月6日