next up previous contents
次へ: 継続時間の考慮 上へ: 言語クラスタリング法の予備実験 戻る: 初期実装   目次


ポーズの考慮

4.4.4節の実験では,ポーズ(pau)の位置を考慮した場合における音声品質 を調査する.ポーズを考慮した場合の言語クラスタリング法における音声合成の 流れを図23に,図23の詳細な手順を以下に示す. 以下に実験手順を示す.

  1. データベース中の音節素片8,138個をポーズ(``pau'')の位置に基づいて, 始端音節,中間音節,終端音節の3つのグループに分類する.

  2. 手順1の3つのグループと,作成する音声のラベルを入力データとして準備 する.

  3. 手順2で示す入力データを,上位のルールから順に照合し,適合した音節 素片が1つ以上存在するクラスタが得られた時点で,照合を停止する.

  4. ルールより得られたクラスタ中の音節素片を,ランダムに1つ選択する.

  5. 手順4で選択した音節素片を含む音声を,ランダムに1つ選択する.

上記手順3,4,5を,作成する合成音声の各モーラ位置に対して行い,手順4で選択 した各音節素片を接続することで合成音声を作成する.

ポーズを考慮した場合におけるオピニオン評価実験の結果,言語クラスタリング 法で作成した音声は3.4という値が得られ,初期実装と比べて0.3向上した.また 4.4.4節の実験では,手順5において,手順4で選択した音節素片を含む音声 をランダムに1つ選択した.しかし各音声には継続時間のばらつきがあり,継続 時間は音声品質に多大な影響を与える可能性がある.

図 23: 言語クラスタリング法における合成音声作成の流れ図(ポーズの考慮)
\includegraphics[width=15cm]{second_exp.eps}



平成21年3月6日