next up previous contents
次へ: 木に基づくクラスタリングを利用した波形接続型音声合成の問題点 上へ: 木に基づくクラスタリングを利用した波形接続型音声合成の例 戻る: 特徴パラメータ:FBANK   目次

特徴パラメータ:MFCC

特徴パラメータとしてMFCCを使用した際の合成音声の例を図13に示す.

図 13: 木に基づくクラスタリング(MFCC)を利用した波形接続型音声合成の例
\includegraphics[width=15cm]{clustering2.eps}

13において,左側の音声が本研究で作成した合成音声であり,右側 の音声において,太字部分で示されている音節素片の波形データを切り出し,接 続する事で合成音声の作成を行う.なお図中の「_ |  ̄」はアクセントの高低を表す.

また図13の波形データを,図151821に示す.更に図12と図13に関する詳細な情報を, それぞれ図16,図19,図22に示す.なお図 中の網掛けされた部分は,クラスタリングにより緩和された言語的な情報を示し ている.

図 14: 「乗り物」の波形データ(FBANK)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{FBANK_norimono.eps}

図 15: 「乗り物」の波形データ(MFCC)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{MFCC_norimono.eps}

図 16: 音声「乗り物」についての詳細
音声「乗り物」についての詳細を図16に示す.
\includegraphics[width=17cm]{detail1.eps}
図において網掛け部分は自然音声と比べて,言語情報が緩和されている部分を示 している.またクラスタリング音声の詳細における音節情報は,特徴パラメー タごとの組み合わせの太字で表されている部分の音節情報を示している.

図 17: 「内職」の波形データ(FBANK)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{FBANK_naishoku.eps}

図 18: 「内職」の波形データ(MFCC)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{MFCC_naishoku.eps}

図 19: 音声「内職」についての詳細
音声「内職」についての詳細を図19に示す.
\includegraphics[width=17cm]{detail2.eps}
図において網掛け部分は自然音声と比べて,言語情報が緩和されている部分を示 している.またクラスタリング音声の詳細における音節情報は,特徴パラメー タごとの組み合わせの太字で表されている部分の音節情報を示している.

図 20: 「見掛け」の波形データ(FBANK)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{FBANK_mikake.eps}

図 21: 「見掛け」の波形データ(MFCC)
\includegraphics[width=15cm]{time.eps} \includegraphics[width=14cm]{MFCC_mikake.eps}

図 22: 音声「見掛け」についての詳細
音声「見掛け」についての詳細を図22に示す.
\includegraphics[width=17cm]{detail3.eps}
図において網掛け部分は自然音声と比べて,言語情報が緩和されている部分を示 している.またクラスタリング音声の詳細における音節情報は,特徴パラメー タごとの組み合わせの太字で表されている部分の音節情報を示している.


next up previous contents
次へ: 木に基づくクラスタリングを利用した波形接続型音声合成の問題点 上へ: 木に基づくクラスタリングを利用した波形接続型音声合成の例 戻る: 特徴パラメータ:FBANK   目次
平成19年3月12日