next up previous
次へ: 合成,出力 上へ: 提案する合成方法 戻る: 提案する合成方法

音節データベースの作成

(a)
音節部品列の生成:

音声出力したい単語各々を $W_i$, その集合を $W$$=\{W_i\}$ ($i=1\sim L$, ただし $L$ は単語の総数)とする. $W$中の全ての単語を 音節部品ラベルの列 $\{Sy(P,N)_{m,M}\}_i$ $(m=1\sim M_i,i=1\sim L)$ に直す. 音節部品ラベル $Sy(P,N)_{m,M}$ は 以下の情報からなる.

$Sy$ : 音節
$P$ : 直前の音素(前音素環境)
$N$ : 直後の音素(後音素環境)
$m$ : 単語中の当該音節のモーラ位置
$M$ : 単語のモーラ数

例えば「ヨコハマシ」の音節部品列は { ${\rm yo}({\rm },{\rm /k/})_{1,5}$ ${\rm ko}({\rm /o/},{\rm /h/})_{2,5}$ ${\rm ha}({\rm /o/},{\rm /m/})_{3,5}$ ${\rm ma}({\rm /a/},{\rm /s/})_{4,5}$ ${\rm si}({\rm /a/},{\rm })_{5,5}$} となり、「ヨコハママチ」の音節部品列は { ${\rm yo}({\rm },{\rm /k/})_{1,6}$ ${\rm ko}({\rm /o/},{\rm /h/})_{2,6}$ ${\rm ha}({\rm /o/},{\rm /m/})_{3,6}$ ${\rm ma}({\rm /a/},{\rm /m/})_{4,6}$ ${\rm ma}({\rm /a/},{\rm /t/})_{5,6}$ ${\rm ti}({\rm /a/},{\rm })_{6,6}$} となる. 「ヨコハマシ」と「ヨコハママチ」の 「ヨ」,「コ」,「ハ」は,単語のモーラ数が違うため 異なる音節部品ラベルとなる.

(b)
録音:

(1)
(a)で生成した音節部品列に 出現する音節部品ラベルを $W$全体に渡って収集し, 異なり音節部品ラベルの集合 $\{Sy(P,N)_{m,M}\}$$_W$ を抽出する.

(2)
その単語集合から得られる異なり音節部品ラベルが $\{Sy(P,N)_{m,M}\}$$_W$ をカバーするような単語の集合 $W_R$$W$から抽出する.

(3)
$W_R$中の単語を 全て同一話者に発声してもらい,録音する.

(c)
音節部品の作成:(図4)

(1)
録音した音声をラベリングして音節区間を決定し, 録音単語のIDと各音節波形の位置からなる, 音節波形インデックスを作成する.

(2)
音節部品ラベルに対応する音声波形のインデックスを加え,音節部品とする.

(3)
$W_R$中の単語全てにわたって 上記の操作を行い,得られた音節部品でデータベースを作成する.

図: 提案する音声合成方法
\begin{figure}\begin{center}
<tex2html_file> ...



平成14年9月3日