next up previous contents
Next: 発話速度 Up: 音節波形接続方式 Previous: 音節波形接続方式   Contents

モーラ情報とアクセント情報

波形接続型音声合成を含め,一般に音声合成においては,韻律の扱いが問題となる. 韻律を扱う場合,録音音声および出力音声の1#1周波数が必要となる. しかし,正確な1#1周波数を直接推定することは困難である.

一方,音声合成の対象として小さな単位である単語を合成する場合においては, 地名などの固有名詞では1#1周波数のばらつきが比較的小さく, アクセント型がほぼ一意に決まるため, 1#1周波数とモーラ情報の依存関係を効果的に利用することが可能である[1]. そして,このモーラ情報は音素ラベリング[10]や音声認識[11][12]などの分野において効果があることが報告されている.

しかし,より一般的な普通名詞では例えば「雨」と「飴」のように同音異義語が多数現れるため, モーラ情報を考慮しただけでは不適切な音声素片が選択される場合がある. そして,普通名詞で素片選択においてモーラ情報に加えてアクセント型を考慮した研究[3]が行われており,アクセント型が合成音声の自然性を向上するために有効であることが示されている.

そこで本研究では,文節を対象とした場合に素片選択にモーラ情報とアクセント型を考慮することで,どの程度の合成音声の品質が得られるかを調査する.



Jin'ichi Murakami 2005-04-20