next up previous contents
次へ: 目次 上へ: 982003 自動ラベリングを用いた録音編集型音声合成の研究 戻る: 982003 自動ラベリングを用いた録音編集型音声合成の研究   目次

概 要

録音編集方式では、固定部と可変部をつなげた際の違和感を軽減するために、 一般に同一話者による音声を大量に必要とする。しかし、実際に大量の音声を同 一話者から録音するのは困難である。そこで、解決のために「音節波形接続」方 式が提案されている。音節波形接続方式により作成された合成音声の品質は、十 分実用的であることが過去の論文により報告されている[1]。

しかし、従来提案されている音節波形接続方式では固有名詞を対象としており、 普通名詞に対して有効性は示されていない。また、音声を作成する場合に必要と なる音素ラベリングデータは人手によって作成されるため、コストがかかる点が 問題である。ラベリングの負担の軽減のために、精度に問題は残るものの、自動 的に音素ラベリングを行うシステムも提案されている[2]。

そこで本研究では、まず、音節波形接続方式を用いて普通名詞の合成音声を作成 し、普通名詞に対する有効性と問題点を調べた。その結果、了解度は自然音声と ほとんど変わらず、また自然性も十分であることが分かった。

また、自動ラベリングを使用する場合に合成音声の品質にどの程度影響するのか を調査した。それにより、音節波形接続方式の音声合成における、自動ラベリン グの有効性を確認した。その結果、了解度・自然性ともに、ほとんど差はなく、 自動ラベリングが音節波形接続方式に有効であることが示された。



平成14年3月7日