next up previous contents
次へ: 音節波形接続方式 上へ: 032048 音節波形接続型音声合成における自動ラベリングの影響 戻る: 表一覧   目次

はじめに

現在,カーナビゲーションシステムや電車の車内アナウンスなどのように,音 声ガイダンスは様々な場面において利用されている.この音声ガイダンスの作 成には,録音編集方式が広く使われている.録音編集方式というのは,ユーザー に依存しない比較的長い文音声(以下,固定部)と,ユーザーに依存する比較的 短い単語・文節音声(以下,可変部)を別々に録音しておき,必要に応じて組み 合わせることで,目的となる出力音声を作成する方式である.

例えば,「次の交差点を左折です.」という音声ガイダンスを作成したい場合, 「次の◯◯左折です.」という固定部に,「交差点を」という可変部を挿入し て作成する.

録音編集方式を用いた音声合成においては,固定部と可変部を接続した場合に 違和感を軽減するために,一般に同一話者の音声を必要とする.固定部と可変 部を別々に録音することにより,必要となる全ての音声を録音する場合に比 べて,話者に対する負担は若干軽減されるが,可変部に挿入する音声が増大す ると,大量の音声を同一話者から録音するのは困難となる.そこで,固定部は 録音音声,可変部は合成音声を用いる方式がとられている.その合成音声を作 成する方法の1つとして,音節波形接続方式[1]が提案されている.

音節波形接続方式は,言語的なパラメータのみで合成音声を作成する方式であ り,信号処理を加えないで接続することにより,自然性の高い合成音声を作成 できるという特徴がある.この方式の過去の研究としては,固有名詞 [2],普通名詞[3],文節[5]を対象として行わ れた.その結果,品質の高い合成音声が得られたことが報告されている.

しかし,問題点の1つとして,合成音声を作成する際に必要となる音節境界情報 のラベルは,人手によって作成されるため,コストがかかる点が問題である. その解決方法の1つとして,音節境界情報の自動ラベリングが提案されている.

そこで本研究では,音節波形接続方式において,自動ラベリングを使用して作 成した合成音声の品質を調査する.なお,自動ラベリングの研究は,従来から 多くの研究機関で行われており,HMM法とベイズ確率を用いた統計的・確率的モ デルによる方法[8],ルールベースを用いる方法[9], 知識処理に基づく方法[10]などが提案されている.

以降,2章で音節波形接続方式を用いた音声合成について説明する.また,3章 で自動ラベリングについて説明し,4章で実験環境と評価方法について説明する. そして,5章で実験結果を示し,実験結果に対する考察を6章で述べる.



平成19年3月16日