next up previous
次へ: まとめ 上へ: 考察 戻る: モーラ位置およびモーラ長およびアクセントの有効性

ラベリングの精度

音響モデルにFull-covariance HMMを使用した場合,音素境界位置のずれから求 めた標準偏差は,男性話者で21.44ms,女性話者で24.19msであった.人手によっ て求められる音素境界位置のゆらぎは5ms程度といわれているので,さらに精度 を向上させる必要があろう.

しかし,自動ラベリングの応用として,音素片を繋いで合成する音声合成がある. [7][8].この方法において,手動ラベリングを利用して合 成した音声と自動ラベリングを利用して合成した音声を比較した場合,音質に差 が殆んどないことが示されている[9].したがって,音声合成におけ る自動ラベリングの精度は,本論文で示した値で実用上問題がないと考えられる.









平成15年12月22日