next up previous
次へ: ピッチ周波数(モーラ数とモーラ位置) 上へ: 音声合成方法の検討 戻る: 概要


韻律的な特徴を表わすパラメータ
(モーラ数とモーラ位置と音素環境)

本来,自然な文章の音声合成を目指すのであれば,文章全体に渡って韻律的特 徴を予測し,呼気段落レベル,文節レベル,音節レベル,と徐々に細部の特徴 を決定していく必要がある.しかし本論文では録音編集方式によるガイダンス 文の中の可変部の音声合成を前提とし,同一話者が大量の単語を全て発声でき た場合と同じ音声が得られることを目標としている.そこで固有名詞の音声を 合成する場合について考える.

韻律を構成する具体的なパラメータとして,ピッチ周波数,パワー,音韻継続 長などが考えられる.通常はモデルを用いてこれらのパラメータを予測し,合 成音声が予測された値を持つように合成単位の波形をデータベースから選択し たり,選択した波形に処理を加えたりする[3].

本論文では,各合成単位が持つ韻律的特徴(高さ,強さ,長さなど)を個別のパ ラメータで扱うのではなく,固有名詞(単語)内のモーラ位置と固有名詞(単 語)のモーラ数で代表させることができると仮定する.



Subsections

平成14年9月3日