次へ: 音節波形接続型音声合成における合成音声の作成例
上へ: 音節波形接続型音声合成
戻る: 音節波形接続型音声合成
目次
音節波形接続型音声合成の概要
音節波形接続型音声合成[1]は,音声が収録されているデータベースか
ら音節単位で音声波形の一部(以下,音節素片)を取り出し,信号処理をせずに
接続することで,合成音声を作成する.ただし音節素片選択時に表
1に示す7つの言語情報の条件が完全に一致する必要がある.以
下に合成音声を作成する手順を示す.
表 1:
音節波形接続型音声合成における言語情報
1 |
中心の音節 |
2 |
直前の音素(前音素環境) |
3 |
直後の音素(後音素環境) |
4 |
単語のモーラ数 |
5 |
単語のモーラ位置 |
6 |
単語のアクセント型 |
7 |
各モーラ位置のアクセントの高低 |
- データベース中の各音節素片に対して,中心の音節,単語のモーラ数,モー
ラ位置,アクセント型,各モーラ位置のアクセントの高低,前後の音素環
境のラベルを付与する.付与した音節素片の例を表2に示す.
表 2:
音節素片の詳細(例:o-ri0402001+m)
|
- 合成する単語内に含まれる音節素片と,7つの言語情報の条件が完全に一
致する音節素片をデータベース中から選択する.
- 手順2で選択した音節素片を接続し,合成音声を作成する.
平成21年3月6日