通常の認識アルゴリズムでは、各単語の先頭のグリッドは言語の遷移確率と接 続する前の単語の最終状態のグリッドからの音響尤度を足した尤度と自己ルー プの尤度を比較して計算する。この時言語の遷移確率を遅らせて計算する。
例
えば図2.8は、tree-trellisサーチにおいて単
語のbigramを使用したときの図である。この図では、語彙2単
語(と
)で、連続3単語認識のときの
gridを図示している。通常のアルゴリズムでは、
grid 2 では grid 1からの遷移に
の単語bigramの確率を、
grid 3 では grid 1からの遷移に
を、
grid 6 では grid 5からの遷移に
を、
grid 7 では grid 5からの遷移に
をかける。
遅延言語処理は、言語モデルの確率を、単語認識した後に音響尤度とかける。 図2.9に、これを図示する。
図中、
grid 2 は grid 1からの遷移に
の単語bigramの確率を、
grid 3 は grid 1からの遷移に
を、
grid 6 は grid 5からの遷移に
を、
grid 7 は grid 5からの遷移に
をかける。
この方法は、音響モデルで単語が認識されてから言語モデルが駆動される形 で、言語モデルを1単語遅らせて計算するのと同等である。このた め計算量が削減される。ただし、認識率は低下する。
ただし、この方法は本論文では使用していない。