ATRでは、発話テキストを参照しながら人手で音素境界を決定するラベリング作 業において、音素境界が不明瞭な音素区間に対して付与するラベルのことを融合ラ ベルと呼んでいる。この融合ラベルの付与率を4名の話者の自由発話と朗読発話に おいて調査した。この結果を図4に示す。
この図から読 みとれることを以下に示す。
なお、 /i,y/, /u,g/, /N,g/, /N,j/, /f,u/, /i,m/, /k,u/, /u,h/, /u,w/, /u,y/, /u,n/, /N,b/, /N,d/, /N,n/, /a,a/, /e,e/, /e,i/, /i,i/, /k,i/, /o,o/, /o,u/, /s,u/, /sh,i/, /u,u/ などの音素環境は 朗読発話、自由発話ともに、融合ラベルになりがちであった。 また、文末の2音素を調査したところ、 母音では/e/と/u/、子音では/g/と /n/が融合ラベルになりやすかった。