next up previous contents
次へ: 単語のtrigramの平滑化 上へ: 自由発話の文認識実験条件 戻る: 自由発話の文認識実験条件   目次

自由発話の音声データ

音声データは以下に示すような方法で収録した。ただし、評価用の話者は2 名で一般人である。

  1. 朗読発話

    テキストを読みあげた音声データ。テキストの内容は  4.3.1.2 節において使用されたテストデータと同一。 間投詞や言い淀み・言い直しは無い。このデータはtext-closedの実験になる。 評価した文数は261文である。

  2. 疑似自由発話 

    間投詞を含むテキストを読みあげた音声データ。間投詞を除いて、「1 朗読発 話」と発話内容は同一。言い淀み・言い直しは無い。

  3. 自由発話

    話者はテキストを覚えて、その意図を理解し、自由に発話した音声データ。発 話内容は「1朗読発話」と異なる。間投詞や言い直しや未知語を含む。このデー タはtext-closed data に近いが text-open dataの実験といえる。



Jin'ichi Murakami 平成13年1月5日