Next: 研究目的
Up: No Title
Previous: List of Tables
音声認識・合成システムなどの音声情報処理システムの研究において、音素の境
界位置を示す音素ラベリングデータは重要である。
現在、音素ラベリンデータは手作業で作成されている。
この作業はハンドラベリングと言われており、多大な時間を必要とする。
このような負担を軽減するため、大量の音声デー
タベースを対象に、自動的に音素ラベリングを行うシステムが望まれている。
しかしながら、現段階の自動音素ラベリングの精度は不十分であり、さらに高い
精度が求められている。
現在の音素ラベリングでは、特徴パラメータとしてケプストラム、メルケプスト
ラムなどが使われている。音声にはこのほかにもピッチ情報があるが、通常使
用されてない。そこで本研究では、このピッチ情報に着目した音素ラベリング方
法を検討した。
音素ラベリングにピッチ情報を使う方法として、モーラ情報を使用した。
ピッチ情報とモーラ情報には、特定話者の単語の発声におい
て、単語のモーラ数、モーラ位置が決まれば、単語に関係なくピッチ周波数がほぼ決ま
るという関係がある。
この関係から単語のモーラ数、モーラ位置で母音の音素記号を分類(ピッチ情
報を併用して母音を分類)し学習を行い、セグメンテーションを行うことで、音素
境界位置の精度は向上すると推定される。
よって本研究では、モーラ情報を使った場合と使わなかった場合について音素ラ
ベリングを行い、音素境界位置の精度を検討した。
以下、2章で研究目的、3章で過去の研究、4章で音素ラベリングに使われる一般
的知識、5章でピッチ情報とモーラ情報の関係、6章で評価実験、7章で実験結果
を述べる。
maeta tomohiro
2000-03-16