next up previous
次へ: モーラ情報の有効性 上へ: 考察 戻る: 男性話者と女性話者の比較

子音の分類

モーラ情報を使って、全ての音素を分類した場合の音素境界位置の認識精度を調べた。 データベースはMAU、MMY、FAF、FTKを使用し、音響モデルはDiagonalを使用した。 その他の実験条件は表2と同様である。 実験結果を表15、16に示す。

データベースMAUでは、 音素境界位置ずれから求めた標準偏差は23.08msとなり、 モーラ情報を使って母音・促音・撥音を分類した場合の22.56msと比べ、 音素境界位置の精度の向上は見られなかった。 また、音素継続時間のずれから求めた標準偏差は32.13msとなり、 モーラ情報を使って母音・促音・撥音を分類した場合の31.52msと比べ、 音素継続時間の精度の向上は見られなかった。

これは、モーラ情報を使って子音を分類して 音素ラベリングを行っても、子音にはピッチが含まれないために、音素境界位置 の精度は向上しなかったと考 えられる。また各音素HMMの学習データの減少によってHMMの精度が 低下したと考えられる。 しかし、いずれの結果においてもモーラ情報を使用しない場合より精度は向上した。




表: 音素境界位置(Diagonal)
全音素分類 母音,促音, 撥音分類
DB 境界数 平均 標準偏差 境界数 平均 標準偏差
[ms] [ms] [ms] [ms]
MAU 15126 -2.51 23.08 17771 -1.47 22.56
MMY 15048 -1.44 22.45 17663 -0.86 22.12
FAF 15109 -1.47 23.97 17781 -0.30 23.43
FTK 15147 -1.07 22.69 17802 -0.67 22.22
平均 15107.5 -1.62 23.05 17754.25 -0.83 22.58




表: 音素継続時間(Diagonal)
全音素分類 母音,促音, 撥音分類
DB 音素 数 平均 標準偏差 音素数 平均 標準偏差
[ms] [ms] [ms] [ms]
MAU 12921 -4.06 32.13 15186 -4.30 31.52
MMY 12834 -2.24 30.56 15078 -2.66 29.63
FAF 12908 -3.41 34.75 15197 -3.44 33.74
FTK 12834 -2.24 32.76 15215 -3.29 30.88
平均 12874.25 -2.99 32.55 15167.75 -3.42 31.44


next up previous
次へ: モーラ情報の有効性 上へ: 考察 戻る: 男性話者と女性話者の比較
平成13年9月6日