text-open data における認識率

次へ: 自由発話の文認識実験 上へ: trigram model を使用した文認識システムの実験 戻る: 音響尤度と言語の連鎖確率の結合値

text-open data における認識率

trigramの連鎖確率の計算に使用するテキストデータの学習量に対する文認識率の変化を調べた。実験は、言語モデルとしてbigramとtrigram、特定話者認識と不特定話者認識、さらにtext-close data（ＡＴＲの対話データベースにテストデータを加えて連鎖確率を計算した場合）とtext-open data（ＡＴＲの対話データベースから連鎖確率を計算した場合）の合計８種類行なった。実験条件は、表 3 と同一である。また 4.3 節および 4.4 節で述べたポーズ処理はしている。また音響尤度と言語の連鎖確率の結合値 $\alpha$ は 32とした。

この実験結果を図 4 に示す。この図では横軸はtrigram の連鎖確率値を計算するのに使用した学習データの単語数で縦軸は文認識率である。この実験では、 text-closed dataではtrigramのほうがbigramと比較してかなり高い認識性能が得られるが、 text-openにおける実験では、bigramのほうがtrigramよりも認識性能は高いことがわかる。

**図 4:** 学習データ量における認識結果の変化認識率(%)
$\begin{figure}\fbox{ \epsfile{file=figure4.eps,width=70mm}}\end{figure}$

Jin'ichi Murakami 平成13年10月4日