合成音声の評価のために,聴覚実験として,音声研究に関わった経験のない学生 5名を対象に,オピニオン評価実験およ本実験で作成した合成音声を表び追比較 実験を行う.
オピニオン評価実験は,自然に聞こえた度合を5段階(5が最も自然,1が最も不自 然)で評価する.また対比較実験は,発話内容の同じ2種類の音声を順に流し,ど ちらの音声がより自然であるかを評価する.表11に聴覚実 験に使用する音声の種類を示す.表11の音声は,全て女性 話者1名(fyn)に関する3または4モーラの音声であり,本実験ではそれぞれ100単 語ずつ作成する.
名称 | 説明 |
自然音声 | ATR単語発話データベース |
ASETに含まれる音声 | |
ノンクラスタリング音声 | クラスタリングを利用しない音節波形 |
接続型音声合成法で作成した音声 | |
言語クラスタリング音声 | 言語クラスタリング法で作成した音声 |
音響クラスタリング音声 | 音響クラスタリング法で作成した音声 |
ただし言語クラスタリング音声と音響クラスタリング音声は,データベースに存 在しない音声を作成する.一方,自然音声とノンクラスタリング音声は,データ ベース中の音声を作成する.図24に本実験で作成したデータ ベースに存在しない単語を,図25に本実験で作成したデータ ベース中の単語を示す.また図24,25に示 す合成音声を作成する際に用いた音節素片の組合せを付録1,2に示す.
上記の理由として,言語クラスタリング法でデータベース中の音声を作成した場 合,手法の性質上,ほぼ全ての合成音声がノンクラスタリング音声と同じ組合せ の音節素片を用いることになるため,評価が困難になることが挙げられる.