next up previous
次へ: 合成実験 上へ: 地名音声の合成実験 戻る: 地名音声の合成実験

録音必要件数の調査

提案手法においては, 前後音素環境に加えてモーラ数,モーラ位置ごとに 異なる音節部品を準備しなくてはならない. そこでまず, 音節部品の種類数 $\vert\{Sy(P,N)_{m,M}\}$$_W$$\vert$ と それを全てカバーするのに必要な録音地名件数 $\vert$$W_R$$\vert$ を 調査した.

理論的には, モーラ数 $M$ の単語を合成するには およそ $\vert Sy\vert\vert P\vert\vert N\vert M$ 種類の音節部品が必要となる. (ただしここで$\vert Sy\vert$,$\vert P\vert$,$\vert N\vert$は各々 音節$Sy$,前音素環境$P$,後音素環境$N$の種類数を表す.) 音節として長音を考えずに $\vert Sy\vert=100$, $\vert P\vert=7$, $\vert N\vert=18$ 1とすると, 5モーラ語の場合およそ 63,000 種類の音節部品が必要となる. 音節種類として長音も考えるとこの数はさらに増える.

しかし,実際の5モーラの地名全て(およそ 38,500 件)について 出現する音節部品の種類を調べたところ, 音節種類に長音を含めても その数はおよそ 10,700 種類であった. 必要な音節部品が全て含まれるような地名のセットを選出すると, その件数は 6,000 件強 2,合成対象である5モーラ語全体 の16%程度であった(表1参照).

同様に調査した4モーラ語,6モーラ語の結果を 表1に示す. 合成対象 $W$ を4$\sim$6モーラの地名 ($\vert$$W$$\vert=$105,287件) とした場合, 必要な音節部品の種類数 $\vert\{Sy(P,N)_{m,M}\}$$_W$$\vert$ はおよそ 30,000 個であり, 録音が必要な件数 $\vert$$W_R$$\vert$ は合成対象全件数の16%, 17,000件であった.

語頭用の$Sy(P,N)_{1,M}$のように 地名のモーラ数$M$が異なっても韻律の特徴が あまり変わらない音節部品や, $Sy(P,{\rm /b/})_{m,M}$ $Sy(P,{\rm /d/})_{m,M}$ のように 音響的特徴が似ている音節部品 は一つの種類にまとめることで, 録音地名件数はさらに削減できると考えられる.



Jin'ichi Murakami 平成13年10月1日