概要

次へ: 波形の接続単位 上へ: 音声合成方法の検討 戻る: 音声合成方法の検討

概要

本研究の合成対象である単語音声は自然音声である固定部に挿入して使用される. 固定部と可変部の間の違和感を軽減するためには合成音声が固定部の話者の声質を持つことが望まれる.

話者性,自然性を持った音声を合成するために, 合成したい話者の音声を収集し, そこから切り出した音声波形に全く処理を加えずに接続する方式が提案されている[3],[4]. この方式は話者性の保存という点ですぐれた成果をあげているが, 音質がデータベースの品質に大きく依存し, しかもそのデータベースの作成方法や十分性が議論できない.

本研究でも, 収集しておいた単語の録音音声から適切な部分を切りだし, その波形になるべく信号処理を施さずに接続する方式を採用する. ただし,波形の接続単位や韻律的な特徴を表わすパラメータが従来の方法と異なる. 特に韻律的特徴を表わすパラメータとしてモーラ位置とモーラ数という簡単なものを採用したことにより, どのような単語を録音すれば良いのか, その単語はどのようにして選択すれば良いのかを決定することができる.

Jin'ichi Murakami 平成13年10月1日