next up previous
次へ: 文献目録 上へ: tottori 戻る: モーラ情報の有効性

まとめ

モーラ情報を使用した場合と使用し ない場合で、それぞれ特定話者が発話した単語の音素ラベリングを行い、 人手によって求められている音素境界位置と計算によって求められた音 素境界位置を比較し標準偏差を求めた。その結果、音響モデルにDiagonalを使用 した場合、男性話者10人の標準偏差 は、24.43msから22.72msに向上し約1.7ms、女性話者10人の標準偏差は、 29.49msから25.09msに向上し約4.4ms精度が向上した。

また、人手によって求められている音素継続時間と計算によって求められた音素 継続時間を比較し標準偏差を求めた。その結果、男性話者10人の標準偏差は、 35.23msから31.57msに向上し約3.6ms、女性話者10人の標準偏差は、42.65msから 34.73msに向上し約8ms精度が向上した。

モーラ情報を使うことで効果の見られた音韻区間は、母音−母音の区間であった。 音響モデルにFullを使用した場合、母音−母音の男性話者10人の標準偏差は54.52msから40.05msに向上し約14ms、 女性話者10人の標準偏差は70.98msから43.73msに向上し約27ms の精度の向上が見られた。

男性話者と女性話者の実験結果を比較したところ、モーラ情報は男性話者に比べ 女性話者の方が精度向上が大きいことから、モーラ情報は男性話者 より女性話者で良い効果が得られることがわかった。

音響モデルにFullを使用することにより、Diagonalに比べて、ほぼ全ての話者で音素境界 位置、音素継続時間ともに精度が向上した。

今後、最適な実験条件のパラメータの検討やモーラ情報が不特定話 者の音素ラベリングに有効であるか調べる必要がある。



平成13年9月6日