波形接続型音声接続では,人手でラベリングされた情報を利用して音節素片を切り出す. しかし,ラベルに誤りがある場合がある.このとき余分な前後の音声が入ることがある.
木に基づくクラスタリングを利用しない波形接続型音声合成では前後の音素を 考慮している為に多少前後の音があっても違和感無く音声が合成できる. しかし,木に基づくクラスタリングを利用した合成音声では,グループ化された 音素からランダムに音を選択している為に前後環境は考慮されていない. その結果,合成音声に違和感が生じ品質の低下に繋がったと考えている.