next up previous contents
次へ: 近接したフレームにおける言語モデルの類似性の利用 上へ: アルゴリズムの改良 戻る: ビームサーチ   目次

ビームの絞り方

ビームの絞り方には、次の2つの方法がある。

  1. 尤度の閾値

    尤度の閾値でビームを絞る方法は、計算量が少なくてすむためよく利用されている [40]。しかし、認識を行なう前に予め閾値を決めておかなければならないため、 動作が不安定になることがある。

  2. ビーム幅

    一定のビーム幅でビームを絞る方法は、フレームごとにソーティングが必要に なる。そのため、計算量が増大する。だたし、始めにフレームごとに最も高い 最大累積尤度($G_{max}$)からビーム幅$b$の最大累積尤度 ($G_b$)を計算し、 次にこの尤度 ($G_b$)でビームを絞り込むことによって [85]フルソートと比較すると計算量が大幅に削減 できる。

本論文では、histgramソートと呼ばれる方法を採用している。 これは、音声認識において正確なビーム幅$b$を決めなくても、 ある程度幅を持つ $\hat{ b}= b \pm \delta $でも 問題が少ないという点に着目している。

計算方法を以下に示す。

  1. フレームごとに尤度の最大値と最小値を計算する。

  2. 最大値と最小値の間を 適当な幅で区切り、尤度のヒストグラムを作成する。

  3. 最大値から ビーム幅$b$の値に近い尤度($ \hat{G_b}$)を計算する。

  4. ($ \hat{G_b}$)でビームの枝刈りを行う。

2.7にビーム幅4096のときの例を示す。この場合はビーム幅 は4190になっている。

図 2.7: histgram sort
\begin{figure}\begin{center}
\fbox{\epsfile{file=FIGURE/histgram.ps,width=60mm}}\end{center}\end{figure}

このアルゴリズムは、尤度の閾値で枝刈りする方法と ビーム幅で枝刈りする方法の中間のようなアルゴリズムと言える。



Jin'ichi Murakami 平成13年1月5日