パワーに誤差が生じ,波形の傾きが0にならない例を以下に示す.例として「温泉 /o/N/se/N/」のN/se間の提案合成音声の音声波形を示す.表中の縦線部は接続部 を示す.
図6.3は「現役 /ge/N/e/ki/」の「N/e」間の従来合成音声の音 声波形である.表6.2は「現役 /ge/N/e/ki/」の「e」の音 節素片に対して音節境界位置を変更した時に用いたデータである.
位相修正を行う音素は[e] |
開始時間(ms) = 720.000000, 終了時間(ms) = 885.000000 |
切り出す音節全体の時間(ms) = 165.000000 |
開始時間(s) = 0.720000, 終了時間(s) = 0.885000 |
開始ポイント = 11520.0, 終了ポイント = 14160.0 |
切り出す音節のデータ数は2641個 |
周波数分解能は3.906250 |
周波数(hz) : 203.125000 |
最大パワー : 464.034981 |
初期位相(rad) : -1.712709 |
一周期の長さ : 4.923077(ms) |
以上のデータから位相は位相0から-1.341962(ms)の時間差. |
-1.341962(ms)のずれはサンプリング点で-21.471398ポイントのポイント差. |
したがって四捨五入して21ポイント変更. |
図6.4は「現役 /ge/N/e/ki/」の提案合成音声である.前ページ の表6.4に記載しているデータを用いて音節境界位置を変更した 「免疫 /me/N/e/ki/」の「e」の音節素片を用いて作成した.
図6.4の傍線部は接続部を示している.接続部において右部の音 節素片(「現役 /ge/N/e/ki/」の「e」)の波形は初期位相が0になっていない.こ れは右部の音節素片の周波数が音節開始時と終了時で異なっているためだと考え られる.したがって音節開始位置周りのパワーを求めることで誤差を少なくでき る.