next up previous
次へ: 自由発話の文認識実験 上へ: trigram model を使用した文認識システムの実験 戻る: 音響尤度と言語の連鎖確率の結合値

text-open data における認識率

trigramの連鎖確率の計算に使用するテキストデータの学習量に対 する文認識率の変化を調べた。実験は、 言語モデルとしてbigramとtrigram、特定話者認識と不特定話者認 識、さらにtext-close data(ATRの対話データベースにテスト データを加えて連鎖確率を計算した場合)とtext-open data(AT Rの対話データベースから連鎖確率を計算した場合)の合計8種類 行なった。実験条件は、表 3 と同一である。また  4.3 節および 4.4 節で述べたポーズ処理はしている。 また音響尤度と言語の連鎖確率の結合値$\alpha $ は 32とした。

この実験結果を図 4 に示す。こ の図では横軸はtrigram の連鎖確率値を計算するのに使用した学習 データの単語数で縦軸は文認識率である。この実験では、 text-closed dataではtrigramのほうがbigramと比較してかなり高 い認識性能が得られるが、 text-openにおける実験では、bigramの ほうがtrigramよりも認識性能は高いことがわかる。

図 4: 学習データ量における認識結果の変化 認識率(%)
\begin{figure}\fbox{ \epsfile{file=figure4.eps,width=70mm}}\end{figure}



Jin'ichi Murakami 平成13年10月4日