next up previous
次へ: この文書について... 上へ: 002015 モーラ情報を用いた音素ラベリング方式の検討 戻る: モーラ情報の有効性

まとめ


本論文では,単語のモーラ数および単語のモーラ位置が決まれば,単語によら ずピッチ周波数がほぼ決まることを利用して,母音・促音・撥音のHMMを,単 語のモーラ数および単語のモーラ位置で分類して学習を行い,単語の音素境界 位置を求めた.そして,モーラ情報を使用した場合と使用しない場合で,人手 によって求められている音素境界位置と計算によって求められた音素境界位置 を比較し標準偏差を求めた.その結果,音響モデルにFullを使用した場合,男性話者10人の標準偏差は約1.4ms向上し,女性話者10人 の標準偏差は,約3.5ms精度が向上した.また,同様に音素継続時間を比較し 標準偏差を求めた.その結果,男性話者10人の標準偏差は約2.8ms精度が向上 した.また女性話者10人の標準偏差は約5.9ms精度が向上した.したがってモー ラ情報を利用することによる有効性が得られた.

今後の課題として,最適な実験条件のパラメータの検討や不特定話者の実験を行 う必要がある.



参考文献

[1]前田,村上,池原, ''モーラ情報を用いた音素ラベリング方 式の検討''音響学会, 2-Q-23, pp.135-136 (2000-09)

[2]前田,村上,池原, ''モーラ情報を用いた音素ラベリング方 式の検討''信学技報, SP2001-53, pp.25-30 (2001-08)

[3]中川,橋本, ''HMM法とベイズ確率を用いた連続音声の セグメンテーション''信学論, J72-D-II, pp.1-10 (1989)

[4]古市,相澤,井上,今井, ''音声認識におけるルールベース 法による話者独立音素セグメンテーション''音響学会誌 55, pp.707-716 (1999)

[5]鬼山,荒井,山下,北橋,野村,溝口, ''知識処理に基づく 音声自動ラベリングシステム''信学技報, SP90-84, pp.53- 60 (1991)

[6]水澤,村上,東田, ''音節波形接続による単語音声合成''信 学技報, SP99-2, pp.9-16 (1999-05)

[7]Introducing ESPS/waves+ with EnSigTM Entropic Research Laboratory Inc.

[8]HTK Ver2.2 reference manual, 1997 Cambridge Uni- versity


平成14年2月22日