next up previous
次へ: 評価実験 上へ: 地名音声の合成実験 戻る: 合成音声の対象


録音必要件数の調査

提案手法においては, 前後音素環境に加えてモーラ数,モーラ位置ごとに 異なる音節部品を予め録音しておく必要がある. そこでまず, 音節部品の種類数 $\vert\{Sy(P,N)_{m,M}\}$$_W$$\vert$ と それを全てカバーするのに必要な録音地名件数 $\vert$$W_R$$\vert$ を 調査した.

理論的には, モーラ数 $M$ の単語を合成するには およそ $\vert Sy\vert\vert P\vert\vert N\vert M$ 種類の音節部品が必要となる. (ただしここで$\vert Sy\vert$,$\vert P\vert$,$\vert N\vert$は各々 音節$Sy$,前音素環境$P$,後音素環境$N$の種類数を表す.) 音節として長音を考えずに $\vert Sy\vert=100$, $\vert P\vert=7$, $\vert N\vert=18$ [*]とすると, 5モーラ語の場合およそ 63,000 種類の音節部品が必要となる. 音節種類として長音も考えるとこの数はさらに増える.

しかし,実際の5モーラの地名全て(およそ 38,500 件)について 出現する音節部品の種類を調べたところ, 音節種類に長音を含めても その数はおよそ 10,700 種類であった. 必要な音節部品が全て含まれるような地名のセットを選出すると, その件数は 6,000 件強 [*],合成対象である5モーラ語全体 の16%程度であった(表2参照).

同様に調査した4モーラ語,6モーラ語の結果を 表2に示す. 合成対象 $W$ を4$\sim$6モーラの地名 ($\vert$$W$$\vert=$105,287件) とした場合, 必要な音節部品の種類数 $\vert\{Sy(P,N)_{m,M}\}$$_W$$\vert$ はおよそ 30,000 個であり, 録音が必要な件数 $\vert$$W_R$$\vert$ は合成対象全件数の16%, 17,000件であった.


Number of syllable parts and Number of recording words
表: 音節部品種類数と録音地名件数
単語モーラ数 4 5 6 4$\sim$6合計
必要な音節部品種類数 7,606 10,670 12,025 30,301
$\vert\{Sy(P,N)_{m,M}\}$$_W$$\vert$        
地名の全件数 $\vert$$W$$\vert$ 31,222 38,430 35,635 105,287
録音する件数 $\vert$$W_R$$\vert$ 4,560 6,066 6,262 16,888



平成14年9月3日