next up previous
次へ: 単語のtrigramの連鎖確率値の平滑化 上へ: 自由発話認識 戻る: 自由発話認識の実験条件

自由発話の音声データ

音声データは以下に示すような方法で収録した。ただし話者は一般人である。

  1. 朗読発話

    テキストを読みあげた音声データ。間投詞や言い淀み・言い直しは無い。なお、 実験に使用した単語のtrigramの連鎖確率値は、このテキストを加えて計算し た。したがって、このデータの認識実験は、言語モデルに対してtext-closed データの実験になる。

  2. 疑似自由発話 

    間投詞を含むテキストを読みあげた音声データ。間投詞を除いて、「1 朗読発 話」と発話内容は同一。言い淀み・言い直しは無い。

  3. 自由発話

    話者はテキストを覚えて、その意図を理解してから自由に発話した音声データ。 発話内容は「1朗読発話」と異なる。間投詞や言い直しや未知語を含む。この データは、言語モデルに対してtext-openのデータと言えるが、テキストを覚 えて発話したデータであるため、発話内容はtext-closedデータに近い。



Jin'ichi Murakami 平成13年10月2日