next up previous
次へ: まえがき

[

自由発話音声における音素の揺らぎについて



A Discussion of Acoustic Problems in Sponteneous Speech Recognition



村上仁一

Jin'ichi Murakami

ATR自動翻訳電話研究所

ATR Interpreting Telephony Research Labs.

概要:

本論文では、音響的な特徴について、自由発話と朗読発声を比較し た結果を述べる。自由発話の音声認識は今後の大きな課題であるが、 従来の朗読発声の認識と比較すると、さまざまな困難が予想される。 したがって、まず始めに自由発話の持つ特徴を把握するために、音 響的な揺らぎの調査を行なった。その結果、発話速度は自由発話と 朗読発声に差は見られなかったが、視察によるラベリング作業にお いて決定することができなかった音素境界(融合ラベル)は、朗読発 話と比較すると、自由発話では、約2割増加した。また、音素認識 実験を行なったところ、誤り率は約2倍に増加した。ただし、これ らの値は話者によって差がある。



abstract

In this paper, we present a preliminary study of spontaneous speech recognition, describing both the acoustic characteristics of spontaneous speech.

Recognition of spontaneous speech is one of the hardest problems in the speech recognition area, it seems for example to be much more difficult than read speech recognition. To get a better understanding of spontaneous speech, a preliminary study was done to compare spontaneous and read speech. In hand-labeled spontaneous speech, the labeling uncertainty increased by about 20% in number. A phoneme recognition experiment resulted in a factor of two increase in the error rate.




]



論文をps形式でダウンロードする (約1Mbyte)



Jin'ichi Murakami 平成13年10月5日