ここでは、自由発話と朗読発声の音響的な差を調べるために、主に 発話速度および融合ラベルの付与率およびHMMにおける音素認識率 について調査した。その結果、自由発話は文単位の朗読発声と比較 すると、発話速度に大きな差がないが、融合ラベルの出現頻度は約 2割近く増加し、音素認識誤り率は平均で約2倍に増加した。
一方、文節単位の朗読発声と文単位の朗読発声を比較すると、融合 ラベルの出現頻度に大きな差はないが、融合ラベルを除いた音素認 識誤り率は約2倍近くにまで増えた。このような認識誤りの比率は、 文節単位の朗読発声と文単位の朗読発声の比率と同等程度であると 見ることもできる。また、約40%という音素認識率は、見方によっ てはさほど低くないとも考えられる。したがって少なくとも音素モ デルに関しては、自由発話音声認識と朗読認識において大きな差は ないように思われる。
ただし、これらの値は話者によって差がある。特に文単位の朗読発 声に対する自由発話の音素認識誤り率の増加率は、話者MTKとFKNで は大きな差がある。したがって自由発話は、話者によって認識率に 大きな差があることが予想される。
また、自由発話には言語的には言い直しや言い淀みなどが存在する。 この解決方法として、精密な文法を作成することによるHMM-LR法や、 統計的な言語モデルや、認識アルゴリズムとしてスポッティングの 採用も考えられるが、多くの問題点を含んでいると思われる。