next up previous contents
次へ: 3つ以上連続する母音 上へ: フレーズへの適用の考察 戻る: 評価のばらつきについて   目次

データベースの音量のばらつき

従来手法では音量のばらつきが問題となり,自然性が損なわれることがあった. 今回の実験では音量のばらつきを抑えるために,全て同時期に収録した音声を選んで音声を作成した.その結果,音量のばらつきは少なくなり品質の高い音声の作成ができた.

しかし,完全に音量の統一はできず,不自然さが残る音声があった. 特に「が,を,に」などの助詞の音節素片に音量のばらつきが見られた.例とし て今回作成音声の中では「政界を歩いてきた人だ」がある.この「政界を歩いてき た人だ」という音声では,5モーラ目の「を」に使用した音声が他の素片よりも 音量が大きく,「を」が強調されて違和感が現れた.以下に「政界を歩いてきた 人だ」の自然音声と合成音声の音声波形を示す.

なお、上が自然音声で下が合成音声である.




図 2: 「政界を歩いてきた人だ」の波形
\includegraphics[scale=0.5]{screen.eps}

これは文中における第2アクセントなどが原因であると考えられる.文の内容によっ ては,名詞や動詞の後の助詞が強調される場合があり,その強調された助詞によっ て音量のばらつきが生じた. 今後,助詞の音節部分の品質を上げるには,接続部分の音量が同程度の音節素片 を使用する手法が考えられる.



平成20年3月22日