データベースMAUでは、 音素境界位置ずれから求めた標準偏差は23.08msとなり、 モーラ情報を使って母音・促音・撥音を分類した場合の22.56msと比べ、 音素境界位置の精度の向上は見られなかった。 また、音素継続時間のずれから求めた標準偏差は32.13msとなり、 モーラ情報を使って母音・促音・撥音を分類した場合の31.52msと比べ、 音素継続時間の精度の向上は見られなかった。
これは、モーラ情報を使って子音を分類して 音素ラベリングを行っても、子音にはピッチが含まれないために、音素境界位置 の精度は向上しなかったと考 えられる。また各音素HMMの学習データの減少によってHMMの精度が 低下したと考えられる。 しかし、いずれの結果においてもモーラ情報を使用しない場合より精度は向上した。
全音素分類 | 母音,促音, 撥音分類 | |||||
DB | 境界数 | 平均 | 標準偏差 | 境界数 | 平均 | 標準偏差 |
[ms] | [ms] | [ms] | [ms] | |||
MAU | 15126 | -2.51 | 23.08 | 17771 | -1.47 | 22.56 |
MMY | 15048 | -1.44 | 22.45 | 17663 | -0.86 | 22.12 |
FAF | 15109 | -1.47 | 23.97 | 17781 | -0.30 | 23.43 |
FTK | 15147 | -1.07 | 22.69 | 17802 | -0.67 | 22.22 |
平均 | 15107.5 | -1.62 | 23.05 | 17754.25 | -0.83 | 22.58 |
全音素分類 | 母音,促音, 撥音分類 | |||||
DB | 音素 数 | 平均 | 標準偏差 | 音素数 | 平均 | 標準偏差 |
[ms] | [ms] | [ms] | [ms] | |||
MAU | 12921 | -4.06 | 32.13 | 15186 | -4.30 | 31.52 |
MMY | 12834 | -2.24 | 30.56 | 15078 | -2.66 | 29.63 |
FAF | 12908 | -3.41 | 34.75 | 15197 | -3.44 | 33.74 |
FTK | 12834 | -2.24 | 32.76 | 15215 | -3.29 | 30.88 |
平均 | 12874.25 | -2.99 | 32.55 | 15167.75 | -3.42 | 31.44 |