自由発話における個人差を見るために4名の話者を個別に研究した。 この音声データは、ナレータ(アナウンサや声優など音声を使うこと を職業としている人)が申し込み者の役になって発話しているため、 舌打ちの音などはほとんどない。事務局員側とは完全に分離されて録 音されているため音声区間の重畳はない。 収録は遮音室で行なわれ たためドアの開閉音などの日常雑音はない。したがって、この音声デー タは自由発話としてはかなり クリーンな音声であると言ってよい。 このデータの収録条件を表6.4に示す。ただ し、各々の話者の発話内容は異なっている。 なお、通常の話者のデータはラベリングされていないため、研究対象 から除外した。
また、自由発話の音声データを文字に書き起こした後に、間投詞や言 い直しを削除して作成したテキストを自由発話の発声者と同一の話者 が発声し、朗読発話の音声データとして使用した。したがって、同一 話者における自由発話と朗読発話の発話内容は、間投詞および言い直 しを除いてほぼ同一である。
話者 | ナレータ4名 |
収録環境 | 遮音室 |
発話内容 | 国際会議の申し込みに関する参加者と |
事務局の対話 | |
発話様式 | 自由発話 |
「トピック」(質問項目と、その背景 | |
に関する情報)や「バックグラウン | |
ド」(会話の前提になる背景)を詳 | |
細に設定して対話したもの。 | |
入力系 | マイクロフォン、DAT録音 |
データ量 | 13対話 116文 3943音素(MTK) |
18対話 333文 11520音素(MMY) | |
13対話 180文 6918音素(FKN) | |
14対話 195文 7588音素(FAK) |