next up previous contents
次へ: 波形接続型音声合成 上へ: hon 戻る: 表一覧   目次

はじめに

現在,カーナビゲーションシステムや電車の車内アナウンス等のように, 音声ガイダンスを利用したシステムやサービスが様々な場面において利用されて いる.このようなシステムでは,録音編集方式が広く使われている. 録音編集方式では,システムやサービスに必要となる音声を, サービスが利用される時間・場所等を示す固有名詞のように比較的短い単語・文 節(以下,可変部)と,それ以外の比較的長い文節・文(以下,固定部)に区別する. この可変部と固定部を別々に録音し,組み合わせを変化させることで出力音声を 作成する.

例えばカーナビゲーションシステムにおいて,ユーザの入力に対し,「次の目的 地は○○です」という音声が出力される.出力音声において,○○の部分が可 変部,それ以外の部分が固定部に相当する.ユーザが目的地に「鳥取駅」を入力 した場合,出力される音声は「次の目的地は鳥取駅です」となる.

例のように録音編集方式では可変部と固定部の組み合わせにより大量の出力音声 が作成出来る.しかし録音編集方式の問題点の1つとして,可変部と固定部を接 続する際に違和感を生じさせないために,同一話者の音声である必要がある.可 変部と固定部を分離して録音することにより,必要となるすべての音声を録音す る場合に比べて話者に対する負担は若干軽減されるが,可変部に挿入する単語が 増大した場合,同一話者から全ての音声を録音することは困難となる.さらに, 録音環境の違いにより発話速度 $ F_0$ 周波数にばらつきが出るため,安定した 品質の音声を得ることは非常に困難となる.

そこで,固定部と可変部に必要となる音声をすべて音声合成によって作成する 方法が考えられる.例えば,音素や音節,CV,VCVを単位とした規則音声合成が ある.規則音声合成は,古くからTTS音声合成において用いられてきた方法で あり,基本的には,音声の特徴をパラメータとして抽出し,変形することによっ て合成音声を作成する.PSOLA方式による音声合成については,現在も多くの 研究がなされている.また,最近ではHMMを用いて直接音声を合成する研究も 行われている.しかし,いずれの場合においても,直接人の声を録音した音声 に比べ,安定して高い品質を得ることが難しい.

一方,録音した音声波形の一部(以下,音声素片)を用いて別の音声を合成 する方法があり,一般に,波形接続型音声合成と呼ばれる. 波形接続型音声合成は,音声素片を取り出し,接続することによって合成音声 を作成する.接続単位については,音素,CV,VCV,CVCなど,様々な単位が 提案されている.

また波形接続型音声合成は,音声波形に信号処理を加えないた め,自然性の高い音声が作成出来るが,その一方で韻律の扱いが問題となる.し かし本研究で対象とする「普通名詞」を合成する場合において, アクセント型を考慮することで,明瞭性が高く,自然性の高い合成音声の作成が 可能である事が示されている[1].

波形接続型音声合成には,更に音節素片選択時の条件が厳しく,作成出来る音声の 数が少ないという問題がある.過去の研究では,木に基づくクラスタリングを利 用する事で素片選択の条件を緩和し,作成できる音声を増加する事が可能である と報告されている[3].しかし木に基づくクラスタリングを行う際 の最適なパラメー タについては明らかにされていない.そこで本研究では木に基づくクラスタリン グを行う際に,特徴パラメータとしてFBANK及びMFCCを利用し,特徴パラメータ の違いを調査する.同時にクラスタリングに適した言語的な情報の調査も行う. またクラスタリングにより音質の劣化が懸念される為,作成した音声の音質の評 価を行う.

結果として,オピニオン評価実験において,クラスタリングを利用した合成音声 が3.6という高い値を得た.これよりクラスタリングを利用した合成音声は品質 の高い合成音声であることが分かった.

対比較実験において,特徴パラメータによる差を調査した結果,FBANKと比べほ とんど差は無かったが,若干MFCCを用いた合成音声が良いという結果が得られた. また緩和条件による違いを調査した結果,モーラ情報の緩和を用いた合成音声が 良いという結果が得られた.

以上より本研究におけるクラスタリングの最適なパラメータは,特徴パラメータ としてMFCC,緩和条件としてFBANKであることが分かった.

以降,2章,3章,4章で波形接続型音声合成,HTKを用いた音節モデルの作成,木 に基づくクラスタリングの説明を行う.また5章で木に基づくクラスタリングを 利用した波形接続型音声合成について説明し,6章で実験条件を述べる. 7章で実験結果を報告し,その考察を8章で行う.



平成19年3月12日