next up previous
次へ: 自由発話の認識実験結果 上へ: 自由発話認識 戻る: 自由発話の音声データ

単語のtrigramの連鎖確率値の平滑化

単語trigramは語彙数の3乗のパラメータの数をもつ。したがって全ての trigramの値を直接推定できるだけの大量のテキストデータを収集することは 困難である。そのため通常trigramの連鎖確率値を平滑化して使用する。ここ ではdeleted-interpolation[15] を使用した。そして、単語の trigramの値を平滑化した場合としなかった場合の両方で認識実験を行った。



Jin'ichi Murakami 平成13年10月2日