音節波形接続型音声合成[2]は,言語的なパラメータのみで音声 合成を作成する方法である.これは,信号処理を行わずに接続することによ り,自然性の高い合成音声が作成できる.この方式は,過去に固有名詞 [3],普通名詞[4],そして文節[6]を対象と して,音声合成が行われた.その結果,品質の高い合成音声が得られた.
しかし,音声合成を作成する場合に必要となるラベリングデータは,人手に よって作成されるため,コストがかかる.そこで,本研究では文節発声の音 声に対して,不特定話者の自動ラベリングをおこない,音節波形接続型で作 成した合成音声の品質を評価する.
なお,自動ラベリングの研究は,従来から多くの研究機関で行われており, HMM方法とベイズ確率を用いた統計的・確率的モデルによる方法 [10],ルールベースを用いる手法[11],知識処理に 基づく方法[12]などが報告されている.