next up previous
次へ: 録音必要件数 上へ: 音声合成方法の検討 戻る: パワー,音韻継続長 (音素環境)

波形の接続単位(音節)

音声の波形を単に接続する合成方法では,同じ音韻でも発声環境によりさまざ まな特徴を持った音声波形が必要になる.そのため高品質な合成音声を得るた めには大規模なデータベースが必要になる.データベース規模を小さく抑える ためには波形の接続単位は短い方が良いため,既存の研究では接続の最小単位 を音素としているものが多い [3], [5].しかし本論文 では了解度の点を考慮して,波形接続の最小単位を音節とする.

音節の知覚においてスペクトルの最大変化点(すなわち子音から母音への遷移 領域)が重要な役割を果たすことが指摘されている[6].音素単位の 接続の場合,データベースから選択された音声波形によっては接続時に必ずし も滑らかなスペクトル遷移が得られるとは限らない.この場合は音節明瞭度が 悪化し,合成された単語音声の了解度が落ちると考えられる.合成音声がユー ザに情報を提示するために使用される場合,特に前出の番号案内システムのよ うに文脈が理解の補助にはならない場合には,単語了解度は重要である.従っ て,音節明瞭度を重視し,子音から母音への遷移領域は切り離さずに扱う方が 良いと考えられる.



平成14年9月3日