next up previous contents
次へ: オピニオン評価実験 上へ: 言語クラスタリング法の音声品質調査実験 戻る: 実験環境   目次

合成音声の評価方法

合成音声の評価のために,聴覚実験として,音声研究に関わった経験のない学生 5名を対象に,オピニオン評価実験およ本実験で作成した合成音声を表び追比較 実験を行う.

オピニオン評価実験は,自然に聞こえた度合を5段階(5が最も自然,1が最も不自 然)で評価する.また対比較実験は,発話内容の同じ2種類の音声を順に流し,ど ちらの音声がより自然であるかを評価する.表11に聴覚実 験に使用する音声の種類を示す.表11の音声は,全て女性 話者1名(fyn)に関する3または4モーラの音声であり,本実験ではそれぞれ100単 語ずつ作成する.


表 11: 聴覚実験に使用する音声の種類
名称 説明
自然音声 ATR単語発話データベース
  ASETに含まれる音声
ノンクラスタリング音声 クラスタリングを利用しない音節波形
  接続型音声合成法で作成した音声
言語クラスタリング音声 言語クラスタリング法で作成した音声
音響クラスタリング音声 音響クラスタリング法で作成した音声

ただし言語クラスタリング音声と音響クラスタリング音声は,データベースに存 在しない音声を作成する.一方,自然音声とノンクラスタリング音声は,データ ベース中の音声を作成する.図24に本実験で作成したデータ ベースに存在しない単語を,図25に本実験で作成したデータ ベース中の単語を示す.また図24,25に示 す合成音声を作成する際に用いた音節素片の組合せを付録1,2に示す.

上記の理由として,言語クラスタリング法でデータベース中の音声を作成した場 合,手法の性質上,ほぼ全ての合成音声がノンクラスタリング音声と同じ組合せ の音節素片を用いることになるため,評価が困難になることが挙げられる.

図 24: 本実験で作成したデータベースに存在しない単語
\includegraphics[width=11.5cm]{make_voice_no.eps}

図 25: 本実験で作成したデータベース中の単語
\includegraphics[width=11.5cm]{make_voice_yes.eps}



平成21年3月6日