next up previous
次へ: 閾値の変化による正規化値の比の変化 上へ: パワー正規化実験 戻る: 検聴による正規化値

本方式による正規化値


次に、提案した方式による正規化値($NP_c$)を求めた。HMMの学習にはHTKを 使用した。学習条件を表3に示す。



表 3: 音素モデルの学習条件
音響モデル 4状態3ループ混合分布型HMM
混合数 10 混合 full covariance
音響パラメータ log power + 12次 FFT melcep +
  $\Delta $ log power + 12次 $\Delta $ FFT melcep
学習データ ATR C セット文発声データ
話者 女性 32名
データ数 1600 文
フレーム長 5ms
フレーム窓長 25ms
sampling 周波数 16KHz


提案した方式による正規化値($NP_c$)と検聴による値($NP_h$)の比(以後 $NP_r = NP_c / NP_h $)を図3に示す。ただし、閾値は( $T_L
= 0.5 , T_B = 2.0$ ) とした。


図 3: 提案した方式と検聴による正規化値の比 ($NP_r$)
\begin{figure}\begin{center}
\fbox{\epsfig{file=figure/dist_nrm_F001_F008.ps,height=45mm,width=75mm}}\end{center}\end{figure}

この図から、比($NP_r$)が小さいことが分かる。したがって提案した方式は有 効であることが分かる。




平成15年9月30日