next up previous
Next: 音節波形接続方式 Up: 波形接続型音声合成の文節への適用 Previous: 波形接続型音声合成の文節への適用

はじめに


高い品質の合成音声を作成する方法としてCHATR[1]がある.CHATRは合成したい話者の音声をあらかじめ録音しておき,そこから部分的に切り出した音声波形を信号処理をせずに接続して音声を合成する方法である.

そして、これと似た手法で単語の音声合成を行うのが音節波形接続方式[2]である. 音節波形接続方式は,あらかじめ録音しておいた音声波形を,音素単位や音節単位などで分割し,接続することによって合成音声を作成する方法である. 波形に信号処理を行わずに接続をすることにより,話者性と高い自然性が保たれる特徴がある[2].

一方,音節波形接続方式においては,韻律の扱いが問題となる. そこで,この問題の一つの解決法として,モーラ情報を用いる方法が提案されている. 文献[2]では地名を対象として実験を行い,実用的な品質が得られたことが報告されている. また文献[3][4]において,普通名詞に適用した場合も,明瞭性の高い合成音声が作成でき,さらにアクセント型を考慮することで,より自然音声に近い音声を作成可能であることが示されている. しかし,これらの研究は名詞を対象としたものであり,文や文節を対象とした研究は行われていない.

そこで本研究では,文節発声で発話速度が遅い音声を使用して,アクセント型を波形選択に利用した音節波形接続方式の文節に対する有効性の確認を行う.


Jin'ichi Murakami 2005-04-20