next up previous
次へ: 自由発話の音響的な特徴 上へ: main4 戻る: まえがき

調査に用いたデータベース

現在ATRでは、各種言語現象を調査するために対話文を中心とす る言語データベースの作成を進めているが[6]、この目的 のために録音された音声は、同時に、音声データベースとして利用 できる。本来は、自由発話音声の収録は、話者に録音していること を気づかれずに録音することが好ましい。しかし、そのような会話 を収録すると、通信の守秘義務などの問題ばかりでなく、話題が次々 に移行して、使われる単語は膨大な種類になるという問題もある。 このため、会話にある程度の制約を入れた模擬会話で収録すること が現実的である。そこで、ATRでは、役割を与えられた2名の話者に より行なわれた会話音声を録音収録し、後に文字化して言語データ ベースを作成している [7]。現在、発話内容で5種類、収録環境で2種類、 話者で2種類、発話様式で2種類の variety を含むデータベース を収集中である[6]。

今回の調査に使用した音声データはこの一部分で、これの収録条件 を表1に示す。発話内容は、電話による 国際会議の問い合わせと旅行案内の問い合わせの2種類である。ま た、音声データは、遮音室でアナウンサーが発声したもので、ドア の開閉音などの日常雑音や話者の舌打ちの音などは含まれていない。 両話者は、完全に分離されて録音されているため、音声区間の重畳 はない。この意味で、この音声データは、自由発話音声としてはか なり clean な音声であると言ってよい。

一方、今回の調査に使用した言語データは、国際会議の問い合わせ に関する音声データを文字化したもので、申し込み者役にはアナウ ンサーの他に一般の話者も含まれているが、対応する事務局員役は、 その分野の専門家が演じている。これの収録条件を表 2に示す。


表 1: 調査に用いた自由発話の音声データの収録条件
発声者 アナウンサー
収録環境 遮音室
発話内容 電話による国際会議の問い合わせ:
  電話による旅行案内の問い合わせ:
入力系 マイクロフォン、DAT録音
データ量 4対話86文
音素数 約3300音素
発話様式 自由発話


表 2: 調査に用いた自由発話の言語データの収録条件
発話内容 国際会議の申し込みに関する参加者と
  事務局の対話
  「トピック」(質問項目と、その背景
  に関する情報)や「バックグラウン
  ド」(会話の前提になる背景)を詳
  細に設定して対話したもの。
データ量 3178対話、11054文
発話様式 自由発話
発話環境  
1 通常の部屋 大部分が家庭用のカセットテープ
  レコーダで録音。外来雑音も混在。
2 スタジオ録音 DATで録音。明瞭。
(遮音室)  
話者  
1 事務局員役 当該分野の専門家
2 申し込み者役 アナウンサ + 一般話者



Jin'ichi Murakami 平成13年10月5日