next up previous
次へ: 考察 上へ: 実験結果 戻る: 実験結果

音素境界位置

音響モデルにFull-covariance HMMを用いた場合 に,計算した音素境界位 置と人手によって付与された音素境界位置の差の平均値と標準偏差を表 45に示す.表4は男性話 者10名の結果で,表5は女性話者10名の結果である.


Phone Boundary Positions - Male - (Full)
表: 男性話者の音素境界位置(Full)
   モーラ無し モーラ有り                
DB  調査音素数   平均値   標準偏差   調査音素数   平均値   標準偏差  
   $n$   $E_p (ms) $   $ \sigma_p (ms) $   $n$   $E_p (ms) $   $ \sigma_p (ms) $  
MAU  18144   -1.62   22.12   16875   -2.35   21.60  
MHT  18141   0.31   24.89   16663   0.18   22.66  
MMS  18150   -2.35   20.75   16768   -1.98   19.39  
MMY  18035   -1.70   21.91   16833   -1.72   21.29  
MNM  18148   -1.37   21.84   16913   -0.89   20.67  
MSH  18143   -3.02   24.62   16828   -2.57   23.55  
MTK  18157   -1.30   24.68   16466   -1.80   24.05  
MTM  18159   -1.24   23.16   16760   -2.86   20.95  
MTT  18165   -2.42   21.78   16887   -2.28   19.30  
MXM  18153   -1.63   22.14   16770   -2.02   20.96  
平均      -1.63   22.79       -1.83   21.44  


Phone Boundary Positions - Female - (Full)
表: 女性話者の音素境界位置(Full)
   モーラ無し モーラ有り                
DB  調査音素数   平均値   標準偏差   調査音素数   平均値   標準偏差  
   $n$   $E_p (ms) $   $ \sigma_p (ms) $   $n$   $E_p (ms) $   $ \sigma_p (ms) $  
FAF  18162   -0.91   28.62   16992   -0.84   23.07  
FFS  18090   -0.79   30.60   16823   -0.17   24.32  
FKM  18164   -0.34   26.16   17059   -1.23   21.50  
FKN  18143   1.67   29.51   16990   1.81   28.62  
FKS  18145   -1.74   25.73   16946   -1.34   22.71  
FMS  18158   -2.91   24.65   17033   -1.22   21.69  
FSU  18040   -0.32   26.86   16929   -0.37   23.72  
FTK  18157   -2.20   24.25   16926   -1.73   21.79  
FYM  18129   0.91   28.02   16973   1.66   24.35  
FYN  18148   -1.01   32.09   17146   -0.22   30.10  
平均      -0.76   27.65       -0.37   24.19  

4$\sim$ 5より,全ての話者においてモーラ 情報を使用することで,標準偏差が小さくなっていることがわかる.

Full-covariance HMMを用いた場合,モーラ情報を使用することにより,男 性話者の場合の標準偏差は平均1.4ms$(22.79-21.44)$精度が向上した.また女 性話者の場合の標準偏差は約3.5ms$(27.65-24.19)$精度が向上した.

なお,Full-covariance HMMは,Diagonal-covariance HMMと比較するとモーラ情 報を使用することにより,男性話者の場合の標準偏差は平均約 1.7ms$(24.43-22.72)$精度が向上した.また女性話者の場合の標準偏差は約 4.4ms$(29.49-25.09)$精度が向上した.FTK を除き,音響モデルに Full-covariance HMM を使用した方が,Diagonal-covariance HMM より精度は良 かった.

以上の実験により,モーラ情報の有効性が確かめられた.


next up previous
次へ: 考察 上へ: 実験結果 戻る: 実験結果
平成15年12月22日