next up previous contents
次へ: 言語クラスタリング法におけるルール 上へ: 言語クラスタリング法 戻る: 言語クラスタリング法   目次


言語クラスタリング法の概要

従来研究である音響クラスタリング法において,言語情報の条件を緩和すること で,理論上全ての音声が作成可能であると示された.しかし,音声品質の非常に 悪い音声が生成されてしまう場合がある.その原因の1つとしてMFCCの距離尺度 が,音声品質に悪影響を与える可能性があると考えられる.

そこで本研究では,MFCCの距離尺度の代わりに,言語情報と人間の聴覚的な知識 (ルール)を用いて木に基づくクラスタリングを行い,音節波形接続型音声合成 法に適用する.本研究では上記の手法を``言語クラスタリング法''と呼ぶ.図 17に合成音声「財務(za/i/mu)」を作成する場合の``言語クラス タリング法''における流れを示す.また以下に図17の詳細な手 順を示す,

  1. データベース中の音節素片8,138個をポーズ(``pau'')の位置に基づいて, 始端音節,中間音節,終端音節の3つのグループに分類する.

  2. 手順1の3つのグループと,作成する音声のラベルを入力データとして準備 する.

  3. 手順2で示す入力データを,上位のルールから順に照合し,適合した音節 素片が1つ以上存在するクラスタが得られた時点で,照合を停止する.

  4. ルールより得られたクラスタ内の音節素片を,ランダムに1つ選択する. クラスタの例を表6 に示す.


    表 6: 言語クラスタリング法におけるクラスタの例
    クラスタ名 N_5 za_3
      a-N0202001+pau pau-za0201011+i
    クラスタ内の a-N0303001+pau pau-za0401011+i
    音節素片 o-N0303001+pau pau-za0501011+i
      u-N0202001+pau pau-za0601011+i
      u-N0303001+pau  

  5. 手順4で選択した音節素片を含む音声の中で,最も継続時間の長い音声を 選択する.

上記手順3,4,5を,作成する合成音声の各モーラ位置に対して行い,手順5で選択 した各音節素片を接続することで合成音声を作成する.

図 17: 言語クラスタリング法における合成音声作成の流れ
\includegraphics[width=15cm]{last_exp.eps}



平成21年3月6日