next up previous
次へ: まえがき

[

自由発話音声認識における音響的および言語的な問題点の検討



A Discussion of Acoustic and Linguistic Problems in Sponteneous Speech Recognition



村上仁一 嵯峨山 茂樹

Jin'ichi Murakami Shigeki Sagayama

ATR自動翻訳電話研究所

ATR Interpreting Telephony Research Labs.

概要:

本論文では、音声認識の立場から自由発話の特性を調べるために、 その音響的な特徴と言語的な特徴の両面について、朗読発声と比較 して調べた結果を述べる。

自由発話の音声認識は今後の大きな課題であるが、従来の朗読発声 の認識と比較すると、さまざまな困難が予想される。したがって、 まず初めに自由発話の持つ特徴を把握するための予備的な調査を行 なった。音響的な特徴については、視察によるラベリング作業にお いて決定することができなかった音素境界(融合ラベル)は、朗読発 話と比較すると、自由発話の場合、約5割増加した。音素認識実験 を行なったところ、誤り率は約2倍に増加した。また、言語的な特 徴について調べた結果、冗長語は自由発話の文章全体の約4割に、 言い直しは約1割に現れた。



abstract

In this paper, we present a preliminary study of spontaneous speech recognition, describing both the acoustic and linguistic characteristics of spontaneous speech.

Recognition of spontaneous speech is one of the hardest problems in the speech recognition area, it seems for example to be much more difficult than read speech recognition. To get a better understanding of spontaneous speech, a preliminary study was done to compare spontaneous and read speech. In hand-labeled spontaneous speech, the labeling uncertainty increased by about 50% in number. A phoneme recognition experiment resulted in a factor of two increase in the error rate. Filled pauses appeared in 40% of 11,000 sentences of spontaneous speech utterances and false starts were found in 10% of the sentences.




]





論文をps形式でダウンロードする (約1Mbyte)

Jin'ichi Murakami 平成13年10月5日