text-open data における認識率

次へ: 単語のtrigramの値を平滑化した場合の認識率 上へ: 各種パラメータの検討 戻る: 音響尤度と言語の連鎖確率の結合値目次

text-open data における認識率

trigramの連鎖確率の計算に使用するテキストデータの学習量に対する文認識率の変化を研究するために、認識実験を行なった。実験は、言語モデルとして bigramとtrigram、特定話者認識と不特定話者認識、さらにtext-close data （ATRの対話データベースにテストデータを加えて連鎖確率を計算した場合）とtext-open data（ATRの対話データベースにテストデータを加えずに連鎖確率を計算した場合）の合計８種類の実験を行なった。実験条件は、表4.5と同一である。また4.3.2.1節および4.3.2.2節で述べたポーズ処理はおこなった。

この実験結果を図4.13に示す。この図では横軸はtrigram の連鎖確率値を計算するのに使用した学習データの単語数で縦軸は文認識率である。この実験では、text-closed dataではtrigramのほうが bigramと比較してかなり高い認識性能が得られるが、text-openにおける実験では、bigramのほうがtrigramよりも認識性能は高いことがわかり、trigramの算出のためのデータ量の不足を示している。

**図 4.13:** 学習データ量における認識結果の変化認識率(%)
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure7.3.ps,width=100mm}}\end{center}\end{figure}$

Jin'ichi Murakami 平成13年1月5日