音声データは以下に示すような方法で収録した。ただし話者は一般人である。
テキストを読みあげた音声データ。間投詞や言い淀み・言い直しは無い。なお、 実験に使用した単語のtrigramの連鎖確率値は、このテキストを加えて計算し た。したがって、このデータの認識実験は、言語モデルに対してtext-closed データの実験になる。
間投詞を含むテキストを読みあげた音声データ。間投詞を除いて、「1 朗読発 話」と発話内容は同一。言い淀み・言い直しは無い。
話者はテキストを覚えて、その意図を理解してから自由に発話した音声データ。 発話内容は「1朗読発話」と異なる。間投詞や言い直しや未知語を含む。この データは、言語モデルに対してtext-openのデータと言えるが、テキストを覚 えて発話したデータであるため、発話内容はtext-closedデータに近い。