現在ATRでは、各種言語現象を調査するために対話文を中心とする言語データベー スの作成を進めている[15]。本来、対話音声の収録は話者に録音している ことを気づかれずに録音することが好ましいが、通信の守秘義務などの問題の他に、 話題が次々に移行するため会話の語彙が膨大な数になるという問題も生じる。この ため、事前に話題のトピックやバックグラウンドを決め、会議の流れの不自然さを 損なわないように打合せを行った後に収録をしている[16]。現在、発 話内容で5種類、収録環境で2種類、話者で2種類、発話様式で2種類のvariety を含むデータベースを収集中である[15]。
本論文では、このATRの言語データベースの中から、申し込み者と事務局員が国 際会議の問い合わせを想定して集録した音声データの中の4名の話者を、自由発話の 音声データとして利用した。この音声データは、ナレータ(アナウンサや声優など 音声を職業としている人)が申し込み者の役になって発話しているため、舌打ちの 音などはほとんどない。また、事務局員側はこの分野の専門家が演じているが、こ の音声データは調査に用いていない。両話者は完全に分離されて録音されているた め音声区間の重畳はない。 収録は遮音室で行なわれたためドアの開閉音などの日常 雑音はない。したがって、この音声データは自由発話としてはかなり clean な音声 であると言ってよい。このデータの収録条件を表1に示す。 ただし、各々の話者の発話内容は異なっている。
話者 | ナレータ2名(通称MTK,FKN) |
収録環境 | 遮音室 |
発話内容 | 国際会議の申し込みに関する参加者と |
事務局の対話 | |
発話様式 | 自由発話 |
「トピック」(質問項目と、その背景 | |
に関する情報)や「バックグラウン | |
ド」(会話の前提になる背景)を詳 | |
細に設定して対話したもの。 | |
入力系 | マイクロフォン、DAT録音 |
データ量 | 13対話 116文 3943音素(MTK) |
18対話 333文 11520音素(MMY) | |
13対話 180文 6918音素(FKN) | |
14対話 195文 7588音素(FAK) |
また、自由発話の音声データを文字に書き起こした後に、間投詞や言い直しを削除 して作成したテキストを、自由発話と同一の話者が発声した音声を、朗読発話の音 声データとして使用した。したがって、同一話者における自由発話と朗読発話の発 話内容は、間投詞および言い直しを除いてほぼ同一である。
なお、自由発話では文の定義が曖昧になる。本論文では、発話権が相手から渡 されて相手に返すまでの話者の発話を「文」と定義した。したがって、通常、 複数の文と考えられる文が1文になる。発話の例文を表2に 示す。この例文において ``『 』'' で括られた範囲は1文を示している。ま た``『''の前の番号は、文番号である。
1 『[あっ、あの]わたくし、 |
武蔵野電機システム開発研究所の小金沢と申します。』 |
2 『[あのー]参加の申込みをしていたんですけれども、 |
[ちょっと]出られなくなりましたので、 |
[あの]キャンセルしたいんですが。』 |
3『はい。[あのー]キャンセルは書面にてっていうふうに |
書いてあるんですけども、 |
どういうふうにしたらよろしいんでしょうか。』 |
4『[ああー]。』 |
5『[あっ]そうですか。』 |
6『[あっ]そうですか。』 |
7『それでですね、 |
[えーと]80パーセント返していただけるのは |
9月30日までというふうに書いてあるんですけども、 |
[あのー]30日までにそれが届けばですか。 |
そ れとも、こちらが出した[その]消印が |
30日でも(かまい)かまわないんでしょうか。』 |
8『[ああ]そうですか。』 |
9『[あっ]そうですか。』 |
10『わかりました。じゃ、登録ナンバーと名前、住所、所属なんかを |
(かき)書いて、書いたものをお送りすればよろしいですね。』 |
11『はい、どうも、ありがとうございました。』 |