次へ: 提案手法
上へ: 認識手法
戻る: マルチパス法
目次
PMC法は,Parallel Model Combination法[10]の略で,
雑音が重畳した音声を認識する一般的な方法である.雑音環境下での
PMC法のHMMは,音声のHMMと雑音のHMMをパラメータ合成して作成される.パラメータ合成は次節で説明する.
図11に示すように,合成されたHMMは2つのHMMを掛け合わせた構造にな
る.状態遷移確率はそれぞれの遷移確率の積になる.
パラメータ合成は,ケプストラムをスペクトル領域にし,足した後,元に戻すことである.
具体的には,雑音と音声の出現確率が,ケプストラム空間での正規分布で表されているが,雑
音と音声は線形スペクトル領域で加算の関係にあるので,両者の分布をスペクト
ル領域での分布に置き換える.合成されたスペクトル領域での対数正規分布をケ
プストラム領域での正規分布に戻せば,雑音の重畳した音声のHMMの出現確率が
得られる[6].
以下に,パラメータ合成の流れを示す.
- ケプストラ厶領域の平均を
, 共分散行列を
とする
- スペクトル領域の平均を
,共分散分散を
とする
- 対数スペクトル領域の平均を
,共分散分散を
とする
- 音声をS,雑音をN,雑音付加音声をRとする
- kは音声と雑音のエネルギー比の変化に対応するパラメータ
1.フーリエ変換
![$\displaystyle \mu_{log} = \Gamma \mu_{cep}$](img171.png) |
(58) |
![$\displaystyle \Sigma_{log} = \Gamma \Sigma_{cep} \Gamma^{T}$](img172.png) |
(59) |
2.指数変換
![$\displaystyle \mu_{(lin),i} = \exp \{ \mu_{(log),i} + \frac{\sigma^{2}_{(log),ii}}{2}\}$](img173.png) |
(60) |
![$\displaystyle \sigma^{2}_{(lin),ij}=\mu_{(log),i}\mu_{(log),j}exp(\sigma^{2}_{(log),ij}-1)$](img174.png) |
(61) |
3.加算
![$\displaystyle \mu_{(lin\_R)} = \mu_{(lin\_S)} + k_{SNR} \cdot \mu_{(lin\_N)}$](img175.png) |
(62) |
![$\displaystyle \Sigma_{(lin\_R)} = \Sigma_{(lin\_S)} + k^{2}_{SNR} \cdot \Sigma_{(lin\_N)}$](img176.png) |
(63) |
4.対数変換
![$\displaystyle \mu_{(log\_R),i} = log \mu_{(lin\_R),i} - \frac{1}{2} \cdot \{\frac{(\sigma_{(lin\_R),ij})^{2}}{(\mu_{(lin\_R),i})^{2}}+1\}$](img177.png) |
(64) |
![$\displaystyle \sigma^{2}_{((log\_R),ij)} = log \{\frac{\sigma^{2}_{(lin\_R),ij} } {\mu_{(lin\_R),i} \mu_{(lin\_R),j}}+1\}$](img178.png) |
(65) |
5.逆フーリエ変換
![$\displaystyle \mu_{cep\_R} = \Gamma^{-1} \mu_{log\_R}$](img179.png) |
(66) |
![$\displaystyle \Sigma_{cep\_R} = \Gamma^{-1} \Sigma_{(log\_R)} (\Gamma^{-1})^{T}$](img180.png) |
(67) |
本研究では,状態数1混合分布数1と状態数3混合分布数4のHMMを用いるが,パラメータ合成は,状態数1のみで行う事ができ,また複数の混合分布数の加算はできないため,状態数1で混合分布数1と混合分布数4のHMMのパラメータ合成となる.
次へ: 提案手法
上へ: 認識手法
戻る: マルチパス法
目次
平成24年3月20日