音声合成法の手法の一つとして,音節波形接続型音声合成法が提案されている. この手法は,音声が収録されているデータベースから音節単位で波形素片を取り 出し,信号処理をせずに接続することで,自然性の高い音声が合成できる.しかし データベースから音節単位で波形素片を取り出す際,7つの言語情報の条件が完 全に一致する必要がある.そのため,任意の一般名詞を作成する際に大量の録音 単語が必要となる.
そこで従来研究において,音節波形接続型音声合成法に,言語情報とMFCCの距離 尺度の両方を用いた木に基づくクラスタリングを適用する手法が提案された.本 研究では,上記の手法を``音響クラスタリング法''と呼ぶ.``音響クラスタリン グ法''は,データベースから音節単位で波形素片を取り出す際,7つの言語情報 の条件を完全に一致させるのではなく,一部の言語情報の条件を言語情報とMFCC の距離尺度の両方を用いた木に基づくクラスタリングの結果を用いて緩和する. 言語情報の条件を緩和することで,理論上全ての音声が作成可能であると示され た.しかし,音声品質の非常に悪い音声が生成されてしまう場合があった.本研 究では,この原因として,音声合成において,MFCCの距離尺度と音声品質との間 の相関が低いためであると仮定した.そこで本研究では,MFCCの距離尺度の代わ りに,言語情報と人間の聴覚的な知識を用いて木に基づくクラスタリングを行い, 音節波形接続型音声合成法に適用した.本研究では上記の手法を``言語クラスタ リング法''と呼ぶ.以上より本研究では,``言語クラスタリング法''で作成した 合成音声の音声品質調査を目的とする.音声品質調査には,オピニオン評価実験 および対比較実験を用いた.
オピニオン評価実験の結果,``言語クラスタリング音声''が3.22,``音響クラス タリング音声''が2.48という値を得た.また,対比較実験の結果,``言語クラス タリング音声''が77.8%,`` 音響クラスタリング音声''が22.2%となった.聴 覚実験の結果より,``言語クラスタリング音声''は,`` 音響クラスタリング音 声''より高い音声品質であると示され,``言語クラスタリング法''の有効性を確 認した.