表9と表11より,音節開始時間および音節終了時間に おいて,自動ラベルは手動ラベルに比べ,約25ms早めにラベリングする傾向が あることが分かった.しかし,図11,図12より,自動ラ ベルと手動ラベルの差の頻度が最大となる時間は0ms付近にあることから,全 体の自動ラベルに対し,補正を加えるべきではないと考えている.
しかし,表10,表12,表14から
得られた結果より,自動ラベルと手動ラベルの差が大きい特定の音節(無声摩
擦音「p,t,k」,連続母音「e-i」を含む音節)に対して,何msの補正を加える
といったルールを追加することで,手動ラベルに近付く可能性はあると考えて
いる.
また,本研究における不特定話者と従来の研究[11]における特 定話者の,自動ラベルと手動ラベルの音節境界位置および音節継続時間の差の 平均値と標準偏差の結果を表23,表24に示す.
表23と表24より,標準偏差の値に注目すると,音節
境界位置および音節継続時間ともに,不特定話者の標準偏差は特定話者の標準
偏差の約1.5倍大きくなっていることが分かった.しかし,聴覚実験の結果から,
不特定話者の自動ラベリングでも十分な品質が得られた.したがって,コスト
のかかる特定話者の自動ラベリングをする必要はないと考えている.