研究の背景

Next: 録音編集型音声合成の問題点 Up: はじめに Previous: はじめに

研究の背景

現在，カーナビゲーションシステムや電車の車内アナウンスなどのように，音声ガイダンスを利用したシステムやサービスが様々な場面において利用されている．このようなシステムでは，録音編集方式が広く使われている．録音編集方式では，まず，システムやサービスに必要となる音声を，システム利用者の入力やサービスの利用される場所・時間などに依存するような比較的短い単語音声（以下，「可変部」）と，それ以外の比較的長い文節・文音声（以下，「固定部」）に区別する．そして，可変部と固定部を別々に録音しておき，必要に応じて組み合わせることで出力音声を構築する．

例えばカーナビゲーションシステムにおいて，「目的地は○○でよろしいですか．」というガイダンス音声を出力したい場合，○○の部分には，駅名や建物名などの単語音声が挿入される．ユーザーが目的地に「東京駅」を指定した場合，ガイダンス文は「目的地は''東京駅''でよろしいですか．」となる．例の場合，「東京駅」などの駅名や建物名などの単語音声が可変部，「目的地は～」という部分が固定部となる．

Jin'ichi Murakami 2008-08-23