next up previous
Next: 録音編集型音声合成の問題点 Up: はじめに Previous: はじめに

研究の背景

現在,カーナビゲーションシステムや電車の車内アナウンスなどのように,音 声ガイダンスを利用したシステムやサービスが様々な場面において利用されて いる.このようなシステムでは,録音編集方式が広く使われている.録音編集 方式では,まず,システムやサービスに必要となる音声を,システム利用者の 入力やサービスの利用される場所・時間などに依存するような比較的短い単語 音声(以下,「可変部」)と,それ以外の比較的長い文節・文音声(以下, 「固定部」)に区別する.そして,可変部と固定部を別々に録音しておき,必 要に応じて組み合わせることで出力音声を構築する.

例えばカーナビゲーションシステムにおいて,「目的地は○○でよろしいです か.」というガイダンス音声を出力したい場合,○○の部分には,駅名や建物 名などの単語音声が挿入される.ユーザーが目的地に「東京駅」を指定した場 合,ガイダンス文は「目的地は''東京駅''でよろしいですか.」となる.例の 場合,「東京駅」などの駅名や建物名などの単語音声が可変部,「目的地は〜」 という部分が固定部となる.



Jin'ichi Murakami 2008-08-23