表4.7において、入力された文と大きく異なる文が出力 された音声データを調査すると、ポーズの区間から誤りが始まっていることがわ かった。そこで言語モデルにおいてポーズのスキップ、音響モデルにおいてポー ズのHMMの学習をすることで認識性能の向上を試みた。