next up previous
次へ: 謝辞 上へ: 自由発話音声における音響的な特徴の検討 戻る: 自由発話の可能性について

まとめ

ここでは自由発話の認識にむけて、4名のナレータにおける自由発話の音響的な特 徴を調べた。この結果、話者によって相違が見られるが、間投詞が出現する文は文 章全体の 40%から65%を占めることや、間投詞全体の出現頻度の50%から75% は 4種類の間投詞で占めることがわかった。また、言い直しは文章全体の2%から4% に出現することがわかった。

そして、視察による音素ラベリングの結果、自由発話は朗読発話と比較すると、発 話速度は、最も差がある話者でも6%しか増加しないが、融合ラベルの付与率は約 20%も増加する話者がいることがわかった。しかし連続音素認識の実験の結果、認 識精度(Phone Accuracy) は朗読発話と比較すると6%から10%しか減少しないこと がわかった。したがって、これらの点を考慮すると、間投詞や言い直しなどの言語 現象を除けば、少なくとも音素モデルに関しては、同一話者(特定話者)、同一発 話様式において音素のHMMの学習をしたならば、自由発話と朗読発話に大きな差はな いように思われる。

ただし、ここで扱った自由発話は、言葉の対応に慣れた人たちが限定した条件の下 で発話したデータである。したがって、一般の話者が、雑音下で制約の少ない状態 で話した音声では、この論文で調査した結果と若干異なる可能性がある。



Jin'ichi Murakami 平成13年5月7日