next up previous
次へ: まとめ 上へ: 自由発話の言語的な特徴 戻る: 自由発話における言い直しの種類と出現頻度

自由発話の言語的な特徴の考察

本報告では、自由発話と朗読発話の言語的な差を見るために、冗長 語および言い直しの出現頻度を調べた。その結果、言い直しは自由 発話全体の約1割に含まれていることがわかった。また冗長語は種 類は多いが4種類で冗長語全ての出現数の7割を占めていることが わかった。

音声認識に使用される文法の枠組には、有限状態オートマトンや文 脈自由文法、単一化文法などがあるが、これらの文法で、言い直し や言い誤りなどに対応するには、かなりの困難が予想される。しか し、冗長語については、独立語として従来の文法の枠組で扱える可 能性が考えられるため、自由発話全体の約9割の文章は、従来の文 法の枠組で扱える可能性がある。ただし、冗長語を含めると、文法 の perplexity が増大し、音声認識はさらに困難になるかも知れな い。



Jin'ichi Murakami 平成13年10月5日