学習および評価を行うデータには、音声波形データファイルと音声ラベルファイ ルを含むデータベースを使用する。 データベース中の全音声ラベルファイルの母音と撥音を単語の モーラ数・モーラ位置を使用して分類し、モーラ情報を含む音声ラベ ルファイルを作成する。 具体的には、 母音と撥音の音素ラベルの前後に単語のモーラ数・モーラ位置情報をそれぞれ付 け加えることにより、母音と撥音を分類する。 促音は無声音でありピッチは存在しないため、本研究では分類しない。 同様に、子音も分類しない。
音声ラベルがatusa(暑さ)である場 合、1番目と3番目の音素aは、3a1と3a3という音素にそれぞれ置き換えられ、異 なる音素ラベルとして扱う。 音声ラベルファイルの母音と撥音の具体的な分類例を表に示す。
分類前 | a | ts | u | s | a | |
分類後 | 3a1 | ts | 3u2 | s | 3a3 | |
分類前 | k | i | m | a | r | i |
分類後 | k | 3i1 | m | 3a2 | r | 3i3 |
分類前 | zh | i | q | k | e | ng |
分類後 | zh | 4i1 | q | k | 4e3 | 4ng4 |