これまで音声対話システムに関する様々な研究が行われてきた。そして,音声対 話システムの開発も行われている。従来それらは音声認識,言語処理,知識概念 処理,音声合成が個別に研究されてきた。従来の音声対話システムの枠組みを図 1に示す。
認識部と対話処理部が切り離して研究されてきたことから,システムの枠組みは 図1のように認識モデルと対話モデルが個別に存在するものとなってきた。堂下 氏らが編成した「音声による人間と機械の対話」(オーム社)においても問題点と されているが,このような階層的な構造であるため途中段階での誤りが伝搬して しまうため,一般に精度が劣化してしまう。また,従来bigramやtrigramを認識 に用いてきたので,言語処理部で扱えないようなものまで認識してしまう,とい うような問題も存在する。現在では,言語モデルを認識モデルに流用することで, 言語処理で扱えるものだけを認識するような手法も考案されている。その際に問 題となるのは,言語処理可能なものだけを認識可能とするので,認識率が低下し てしまうことである。そこで本研究は,ユーザが認識可能な対話方法を行うよう に,発話に制約を与える必要があると考える。