next up previous contents
次へ: 波形接続型合成音声の問題点 上へ: 波形接続型音声合成 戻る: 波形接続型音声合成   目次

モーラ情報とアクセント情報

波形接続型音声合成を含め,一般的に音声合成においては,韻律の扱いが 問題となる.韻律を扱う場合,録音音声および出力音声の $ F_0$ 周波数が 必要となる.しかし,正確な $ F_0$周波数を直接推定することは困難である.

一方,音声合成の対象として小さな単位である単語を合成する場合においては ,地名などの固有名詞では $ F_0$周波数のばらつきが比較的小さく,アクセント 型がほぼ一意に決まるため, $ F_0$周波数とモーラ情報が依存関係を 効果的に利用することが可能である.そして,このモーラ情報は音素ラベリング や音声認識など分野において効果があることが報告されている.

しかし,より一般的な普通名詞では例えば「雨」と「飴」のように同音 異義語が多数表れるため,モーラ情報を考慮しただけでは不適切な音声素片が 選択される場合がある.そして,普通名詞で素片選択においてモーラ情報に 加えてアクセント型を考慮した研究が行われており,アクセント型が合成音声 の自然性を向上するために有効であることが示されている[1].



Ryo Yamagata(2005) 平成18年5月8日