自由発話の音声データ

次へ: 単語のtrigramの連鎖確率値の平滑化 上へ: 自由発話認識 戻る: 自由発話認識の実験条件

音声データは以下に示すような方法で収録した。ただし話者は一般人である。

朗読発話
テキストを読みあげた音声データ。間投詞や言い淀み・言い直しは無い。なお、実験に使用した単語のtrigramの連鎖確率値は、このテキストを加えて計算した。したがって、このデータの認識実験は、言語モデルに対してtext-closed データの実験になる。
疑似自由発話　
間投詞を含むテキストを読みあげた音声データ。間投詞を除いて、「1 朗読発話」と発話内容は同一。言い淀み・言い直しは無い。
自由発話
話者はテキストを覚えて、その意図を理解してから自由に発話した音声データ。発話内容は「1朗読発話」と異なる。間投詞や言い直しや未知語を含む。このデータは、言語モデルに対してtext-openのデータと言えるが、テキストを覚えて発話したデータであるため、発話内容はtext-closedデータに近い。

Jin'ichi Murakami 平成13年10月2日