本論文では、自由発話の音響的な特徴を調査するために、主に融合ラベルの付与率、 発話速度、HMMにおける音素認識誤り率で朗読発話と比較した。その結果、自由発 話は朗読発話と比較すると、発話速度は最も差がある話者でも6%しか増加しない が、融合ラベルの出現頻度は約20%も増加する話者がいることが示された。しかし、 自由発話と朗読発話の認識精度 (Phone accuracy)の差は7%から10%程度であるこ とが示された。したがって、少なくとも同一話者(特定話者)、同一発話様式で HMMを学習をする限り、音響モデルに関しては自由発話と朗読発話に大きな差はな いように思われる。
ただし、本論文で調査した話者は音声による対話に慣れた人である。したがって、 一般の話者が雑音下で制約の少ない状態で話した音声では、この論文で調査した結 果と異なる可能性がある。