next up previous contents
次へ: 単語のtrigramの値を平滑化した場合の認識率 上へ: 各種パラメータの検討 戻る: 音響尤度と言語の連鎖確率の結合値   目次

text-open data における認識率

trigramの連鎖確率の計算に使用するテキストデータの学習量に対する文認識 率の変化を研究するために、認識実験を行なった。実験は、言語モデルとして bigramとtrigram、特定話者認識と不特定話者認識、さらにtext-close data (ATRの対話データベースにテストデータを加えて連鎖確率を計算した場合) とtext-open data(ATRの対話データベースにテストデータを加えずに連鎖確率を計算した場合) の合計8種類の実験を行なった。実験条件は、表4.5と同一である。また4.3.2.1節およ び4.3.2.2節で述べたポーズ処理はおこなった。

この実験結果を図4.13に示す。この図では横 軸はtrigram の連鎖確率値を計算するのに使用した学習データの単語数で縦軸 は文認識率である。この実験では、text-closed dataではtrigramのほうが bigramと比較してかなり高い認識性能が得られるが、text-openにおける実験 では、bigramのほうがtrigramよりも認識性能は高いことがわかり、trigramの 算出のためのデータ量の不足を示している。

図 4.13: 学習データ量における認識結果の変化 認識率(%)
\begin{figure}\begin{center}
\fbox{\epsfile{file=FIGURE/figure7.3.ps,width=100mm}}\end{center}\end{figure}



Jin'ichi Murakami 平成13年1月5日