自由発話において特徴的な言語現象に、間投詞や言い直し・言い誤り・言い淀みな どがある。そして、今回の調査の結果、間投詞は発話全体の40%から65%の文に、 言い直しは約2%から4%の文に出現することが示された。自由発話の認識には、こ れらの言語現象の処理方法が大きな問題になると考えられる。
現在自由発話の認識アルゴリズムとしては、これらの現象に対応するため、1)キー ワードスポッティングを利用する方法[27]、2)音素モデルにガーベージモ デルなどを使用して認識する方法[28][29]、3)言語モデルの一 部に音素系列として認識する方法[30],[22] もしくはこれ らの組合せの手法[13] などが試みられている。しかし、これらのアルゴリ ズムには挿入誤りが増加することや、広いビーム幅が要求されるなどの問題点が残っ ている。