次へ: a. ピッチ周波数
上へ: 音声合成方法の検討
戻る: .
本来,自然な文章の音声合成を目指すのであれば,
文章全体に渡って韻律的特徴を予測し,
呼気段落レベル,文節レベル,音節レベル,と
徐々に細部の特徴を決定していかなくてはならない.
しかし本研究では録音編集方式による
音声合成を前提としており,
同一話者が大量の単語を全て発声できた場合と
同じ音声が得られることを目標としているので,
孤立単語音声を合成する場合について考える.
韻律を構成する具体的なパラメータとして,
ピッチ周波数,パワー,音韻継続長などが考えられる.
通常は
モデルを用いてこれらのパラメータを予測し,
合成音声が予測された値を持つように
合成単位の波形をデータベースから選択したり,
選択した波形に処理を加えたりする.
本手法では,各合成単位,すなわち音節が持つ
韻律的特徴(高さ,強さ,長さなど)を
個別のパラメータで扱うのではなく,
単語内のモーラ位置と単語のモーラ数で
代表させることができると仮定した.
Subsections
Jin'ichi Murakami
平成13年10月1日