next up previous contents
次へ: 考察 上へ: 各種パラメータの検討 戻る: text-open data における認識率   目次


単語のtrigramの値を平滑化した場合の認識率

単語のtrigramの値にdeleted-interpolationを利用して平滑化した場 合の認識率の変化を表4.11に示す。

なお、平滑化の値は、次式のtrigram,bigram,unigram,フロアリングに対して各々
$ \lambda_3 = 0.35, \lambda_2 = 0.48, \lambda_1 = 0.11, \lambda_0 = 0.06 $
である。


\begin{displaymath}
\hat{ P } (w_i \vert w_{i-2},w_{i-1} ) =
\lambda_3 P (w_i...
... \lambda_2 P (w_i \vert w_{i-2},w_{i-1} ) +
\lambda_1 P (w_i)
\end{displaymath} (4.3)

これから単語のtrigramを平滑化することでtext-open dataにおいて 認識性能が向上することがわかる。


表 4.11: 認識実験の結果(単語のtrigramの値を平滑化したとき) 文認識率(%)
言語model   text open data text closed data
    特定話者 不特定話者 特定話者 不特定話者
base line $1$ 35.6% 33.7% 90.8% 85.1%
  $\sim2$ 37.5% 36.8% 96.6% 93.5%
  $\sim8$ 38.3% 37.9% 98.8% 97.7%
interpolation $1$ 51.7% 43.3% 79.3% 78.2%
  $\sim2$ 58.6% 47.9% 88.5% 86.2%
  $\sim8$ 62.4% 53.6% 91.9% 90.0%

text-closed; ビーム幅:4,096; $\alpha $:1




Jin'ichi Murakami 平成13年1月5日