next up previous contents
次へ: 接続部の修正 上へ: 音節波形接続方式の問題点 戻る: 音節波形接続方式の問題点   目次


ラベルの利用

波形接続型音声合成では,音声合成する音節の接続点を音節境界位置と定義して いる.音節境界位置は,音節開始時刻と終了時刻が記載されたラベルに基づいて 決定される.図2.1から図2.3にラベルの例を示す.図 2.1は「診察 /shi/N/sa/tsu/」のラベルの例を示している.左から音節 開始時刻,音節終了時刻,音節の名前が記載されており,時刻の単位はミリ秒で ある.例えば,開始の音節「pau」は無音を示しており,時刻0ミリ秒から時刻 285ミリ秒に含まれている.同様に,図2.2は「威厳 /i/ge/N/」のラベ ルの例,図2.3は「発音/ha/tsu/o/N/」のラベルの例を示している.ラ ベルは,人手で作成されている.しかし,波形接続型音声合成用ではなくパラメー タ合成用であるため,正確に記載されていないという問題点がある.具体的には, ラベルは人手で作成されており,5ミリ秒間隔で記載されているため,パラメー タ合成では問題ないが,波形接続方式では精度が足りず,音声品質に問題が生じ る.

図 2.1: 「診察」のラベル(ms)
\begin{figure}\begin{center}
\vspace{1mm}
\begin{tabular}{\vert rrc\vert} \h...
...340 & tsu\\
1340 & 1625 & pau\ \hline
\end{tabular} \end{center}\end{figure}

図 2.2: 「威厳」のラベル(ms)

0 295 pau
295 495 i
405 675 ge
675 925 N
925 121 pau
図 2.3: 「発音」のラベル(ms)

0 300 pau
300 550 ha
550 865 tsu
865 1035 o
1035 1295 N
1295 1587 pau
 



平成23年3月16日