本研究では文節発声で発話速度が遅い音声を用いた場合の音節波形接続方式の文節における有効性を調査した. 従来の単語合成に用いられている手法で作成した合成音声は,了解度が98.7%でオピニオンスコアも3.55が得られ,音節波形接続方式が文節に対しても有効であることが分かった.
また,従来手法の問題点の解決のために,音節選択に2つの条件を追加して行った実験では,了解度は99.3%でオピニオンスコアが3.83となり従来手法の値を上まわった. 対比較実験でも60.7%の文節が従来手法よりも品質の高い音声と判定され,追加した2つの条件が素片選択に有効であることが分かった.
一方,自然音声は了解度が99.3%,オピニオンスコアは4.75となった. また,提案手法との対比較では74.3%の文節が自然音声の方が品質が高いと判定された. 了解度では合成音声も自然音声と同程度の値であった. また,自然性の面では自然音声と合成音声の間にまだ差があるが,合成音声も高い品質が得られたことが確認できた.
今後は,接続部の違和感を軽減など様々な制御を導入し,音声の品質を高めることが必要である. また,それと同時に,音声コーパスをより有効に利用できるように,後音素環境における子音のグループ化を検討していくことが重要であると思われる.