本研究では,音節素片を滑らかに接続するために,音節素片のパワーが最大とな
る周波数の初期位相が``-π/2''となる音節境界位置に決める自動化方法を提案
した.また,周波数の誤差に対して本研究では,離散フーリェ変換の窓長を音
節素片の開始時から1周期の整数倍にするために,窓長の最大0.5ms(約
0.0625ms刻み,計17種類)に対して離散フーリェ変換を行い,振幅が最も0に近い
音節開始位置を選択することで修正を試みた.聴覚実験の結果において,提案方
法により作成した合成音声は,オピニオン評価実験,対比較実験の両方の実験に
おいてATRラベルを用いて作成した合成音声より高い品質であることが確認でき
た.特に女性話者の実験結果において人手で作成した合成音声と同等の音声品質
を得ることができ,本研究の目的を達成することができた.したがって,本研究
の有効性が証明された.今後,考察で挙げた問題点を修正することで,男性話者
においても,今回の実験結果より高い音声品質を得ることができると考えている.