next up previous
次へ: 文による次発話予測によるアプローチ 上へ: 背景と目的 戻る: 背景と目的

現状の音声対話システムの問題点

音声対話システムの性能向上においては,ユーザの発話の認識・理解性能の 向上が課題の一つである.

ATISで提案されたシステム[1]に見られるように,近年の音声対話シ ステムの構成例としては,単語N-gramモデル等の言語モデルを用いて得 た認識候補に,ルールベースの文法による言語的な解析をして発話内容を理解 する枠組みが一般的である.しかし,特に単語N-gramモデルによって生 成された認識結果は,言語解析用文法では受理されない文である場合がある. 単語N-gramモデルによる言語解析不可能な文の生成は,探索空間を無駄 に広げ音声認識率を低下させる原因の一つと考えられる.この問題を回避する には,音声認識における言語モデルと言語解析用の文法に同一の言語を規定す る文法を利用する必要がある.

HMM-LR法など,既に言語解析用のルールベース文法を認識用言語モデルとして 用いる手法は提案されている.しかし,言語解析用のルールベースの文法を音 声認識に適用するためには,自然発話における種々の言語現象を盛り込んだ詳 細なルールを記述する必要がある.人手による記述となるため,ルールの詳細 化は困難な作業であり,またルールのメンテナンス不足による非文の生成も問 題となる.



Jin'ichi Murakami 平成13年4月17日