next up previous contents
Next: 研究目的 Up: No Title Previous: List of Tables

まえがき

音声認識・合成システムなどの音声情報処理システムの研究において、音素の境 界位置を示す音素ラベリングデータは重要である。 現在、音素ラベリンデータは手作業で作成されている。 この作業はハンドラベリングと言われており、多大な時間を必要とする。 このような負担を軽減するため、大量の音声デー タベースを対象に、自動的に音素ラベリングを行うシステムが望まれている。 しかしながら、現段階の自動音素ラベリングの精度は不十分であり、さらに高い 精度が求められている。 現在の音素ラベリングでは、特徴パラメータとしてケプストラム、メルケプスト ラムなどが使われている。音声にはこのほかにもピッチ情報があるが、通常使 用されてない。そこで本研究では、このピッチ情報に着目した音素ラベリング方 法を検討した。 音素ラベリングにピッチ情報を使う方法として、モーラ情報を使用した。 ピッチ情報とモーラ情報には、特定話者の単語の発声におい て、単語のモーラ数、モーラ位置が決まれば、単語に関係なくピッチ周波数がほぼ決ま るという関係がある。 この関係から単語のモーラ数、モーラ位置で母音の音素記号を分類(ピッチ情 報を併用して母音を分類)し学習を行い、セグメンテーションを行うことで、音素 境界位置の精度は向上すると推定される。 よって本研究では、モーラ情報を使った場合と使わなかった場合について音素ラ ベリングを行い、音素境界位置の精度を検討した。 以下、2章で研究目的、3章で過去の研究、4章で音素ラベリングに使われる一般 的知識、5章でピッチ情報とモーラ情報の関係、6章で評価実験、7章で実験結果 を述べる。

maeta tomohiro
2000-03-16