next up previous contents
次へ: 自由発話の文認識実験結果 上へ: 自由発話の文認識実験条件 戻る: 自由発話の音声データ   目次

単語のtrigramの平滑化

単語trigramは語彙数の3乗のパラメータの数をもつ。したがって全ての trigramの値を直接推定できるだけの大量のテキストデータを収集することは 困難である。そのため、text-openの音声データを認識させる場合、通常 trigramの連鎖確率値は平滑化して使用される。ここでは deleted-interpolation[27] (4.3.3.4参照)を使用した。また、単語の trigramの値を平滑化した場合としなかった場合の両方で実験を行った。



Jin'ichi Murakami 平成13年1月5日