next up previous contents
次へ: パワーを求める範囲の問題 上へ: 考察 戻る: 考察   目次

初期位相0でのパワーの問題

本研究は,音節素片のパワーが最大となる周波数の初期位相を0とした.これ は,音声波形の傾きが0となる音節境界位置で音節素片を接続することを意味し ている.しかし,パワーが異なる場合,音節境界の波形が連続にならない.そこ で,改善策として初期位相を0ではなく-π/2に修正することが挙げられる.

音節境界の波形が連続にならない例を以下に示す. 例として「会費 /ka/i/hi/」のi/hi間の提案合成音声の音声波形を示す.表中の 縦線部は接続部を示す.

図 6.1: 「会費 /ka/i/hi/」のi/hi間の従来合成音声の音声波形
\fbox{\includegraphics[width=15cm,clip]{kaihi-ihi-mae.eps}}

6.1は「会費 /ka/i/hi/」のi/hi間の従来合成音声の音声波形 である.次ページの表6.1は「会費 /ka/i/hi/」の「hi」の 音節素片に対して音節境界位置を変更した時に用いたデータである.


表 6.1: 「月日 /tsu/ki/hi/」の「hi」の初期位相を0に修正する時に用いた情報
位相修正を行う音素は[h]
開始時間(ms) = 620.000000, 終了時間(ms) = 795.000000
切り出す音節全体の時間(ms) = 175.000000
開始時間(s) = 0.620000, 終了時間(s) = 0.795000
開始ポイント = 9920.0, 終了ポイント = 12720.0
切り出す音節のデータ数は2801個
周波数分解能は3.906250
周波数(hz) : 277.343750
最大パワー : 86.439267
初期位相(rad) : -1.397921
一周期の長さ : 3.605634(ms)
以上のデータから位相は位相0から-0.802203(ms)の時間差.
-0.802203(ms)のずれはサンプリング点で-12.835251ポイントのポイント差.
したがって四捨五入して13ポイント変更.

6.2は「会費 /ka/i/hi/」の合成音声である. 上記の表6.1に記載しているデータを用いて音節境界位置を 変更した「月日 /tsu/ki/hi/」の「hi」の音節素片を用いて作成した.

図 6.2: 「会費 /ka/i/hi/」のi/hi間の提案合成音声の音声波形
\fbox{\includegraphics[width=15cm,clip]{kaihi-ihi-go.eps}}

6.2の傍線部は接続部を示している.接続部において前後の音 節素片のパワーが異なるので,波形が連続にならないことがわかる.これに対し 位相を0ではなく,-π/2にすることで波形の傾きが−から+に変わる点で接続す ることで滑らかに接続することが可能であると考えられる.



平成21年5月25日