next up previous contents
次へ: 子音の問題 上へ: 考察 戻る: 初期位相0でのパワーの問題   目次

パワーを求める範囲の問題

実験結果では音節素片全体のパワーを求めている.しかし,音節の発話開始時と 発話終了時の周波数には差が生じる.そのため,パワーに誤差が生じ,波形の傾 きが0にならない.そこで,発話開始位置周りのパワーを求める必要がある.

パワーに誤差が生じ,波形の傾きが0にならない例を以下に示す.例として「温泉 /o/N/se/N/」のN/se間の提案合成音声の音声波形を示す.表中の縦線部は接続部 を示す.

図 6.3: 「現役 /ge/N/e/ki/」のN/e間の従来合成音声の音声波形
\fbox{\includegraphics[width=15cm,clip]{geNeki-Ne-mae.eps}}

6.3は「現役 /ge/N/e/ki/」の「N/e」間の従来合成音声の音 声波形である.表6.2は「現役 /ge/N/e/ki/」の「e」の音 節素片に対して音節境界位置を変更した時に用いたデータである.


表 6.2: 「免疫 /me/N/e/ki/」の「e」の初期位相を0に修正する時に用いた情報
位相修正を行う音素は[e]
開始時間(ms) = 720.000000, 終了時間(ms) = 885.000000
切り出す音節全体の時間(ms) = 165.000000
開始時間(s) = 0.720000, 終了時間(s) = 0.885000
開始ポイント = 11520.0, 終了ポイント = 14160.0
切り出す音節のデータ数は2641個
周波数分解能は3.906250
周波数(hz) : 203.125000
最大パワー : 464.034981
初期位相(rad) : -1.712709
一周期の長さ : 4.923077(ms)
以上のデータから位相は位相0から-1.341962(ms)の時間差.
-1.341962(ms)のずれはサンプリング点で-21.471398ポイントのポイント差.
したがって四捨五入して21ポイント変更.

6.4は「現役 /ge/N/e/ki/」の提案合成音声である.前ページ の表6.4に記載しているデータを用いて音節境界位置を変更した 「免疫 /me/N/e/ki/」の「e」の音節素片を用いて作成した.

図 6.4: 「現役 /ge/N/e/ki/」のN/se間の提案合成音声の音声波形
\fbox{\includegraphics[width=15cm,clip]{geNeki-Ne-go.eps}}

6.4の傍線部は接続部を示している.接続部において右部の音 節素片(「現役 /ge/N/e/ki/」の「e」)の波形は初期位相が0になっていない.こ れは右部の音節素片の周波数が音節開始時と終了時で異なっているためだと考え られる.したがって音節開始位置周りのパワーを求めることで誤差を少なくでき る.



平成21年5月25日