next up previous contents
次へ: 提案手法 上へ: 認識手法 戻る: マルチパス法   目次

PMC法

PMC法は,Parallel Model Combination法[10]の略で, 雑音が重畳した音声を認識する一般的な方法である.雑音環境下での PMC法のHMMは,音声のHMMと雑音のHMMをパラメータ合成して作成される.パラメータ合成は次節で説明する. 図11に示すように,合成されたHMMは2つのHMMを掛け合わせた構造にな る.状態遷移確率はそれぞれの遷移確率の積になる.

図: HMM合成法(PMC)の原理
\fbox{\includegraphics[width=5cm,clip]{pmc_genri.eps}}
パラメータ合成は,ケプストラムをスペクトル領域にし,足した後,元に戻すことである. 具体的には,雑音と音声の出現確率が,ケプストラム空間での正規分布で表されているが,雑 音と音声は線形スペクトル領域で加算の関係にあるので,両者の分布をスペクト ル領域での分布に置き換える.合成されたスペクトル領域での対数正規分布をケ プストラム領域での正規分布に戻せば,雑音の重畳した音声のHMMの出現確率が 得られる[6].

以下に,パラメータ合成の流れを示す.

1.フーリエ変換

$\displaystyle \mu_{log} = \Gamma \mu_{cep}$ (58)

$\displaystyle \Sigma_{log} = \Gamma \Sigma_{cep} \Gamma^{T}$ (59)

2.指数変換

$\displaystyle \mu_{(lin),i} = \exp \{ \mu_{(log),i} + \frac{\sigma^{2}_{(log),ii}}{2}\}$ (60)

$\displaystyle \sigma^{2}_{(lin),ij}=\mu_{(log),i}\mu_{(log),j}exp(\sigma^{2}_{(log),ij}-1)$ (61)

3.加算

$\displaystyle \mu_{(lin\_R)} = \mu_{(lin\_S)} + k_{SNR} \cdot \mu_{(lin\_N)}$ (62)

$\displaystyle \Sigma_{(lin\_R)} = \Sigma_{(lin\_S)} + k^{2}_{SNR} \cdot \Sigma_{(lin\_N)}$ (63)

4.対数変換

$\displaystyle \mu_{(log\_R),i} = log \mu_{(lin\_R),i} - \frac{1}{2} \cdot \{\frac{(\sigma_{(lin\_R),ij})^{2}}{(\mu_{(lin\_R),i})^{2}}+1\}$ (64)

$\displaystyle \sigma^{2}_{((log\_R),ij)} = log \{\frac{\sigma^{2}_{(lin\_R),ij} } {\mu_{(lin\_R),i} \mu_{(lin\_R),j}}+1\}$ (65)

5.逆フーリエ変換

$\displaystyle \mu_{cep\_R} = \Gamma^{-1} \mu_{log\_R}$ (66)

$\displaystyle \Sigma_{cep\_R} = \Gamma^{-1} \Sigma_{(log\_R)} (\Gamma^{-1})^{T}$ (67)



本研究では,状態数1混合分布数1と状態数3混合分布数4のHMMを用いるが,パラメータ合成は,状態数1のみで行う事ができ,また複数の混合分布数の加算はできないため,状態数1で混合分布数1と混合分布数4のHMMのパラメータ合成となる.


next up previous contents
次へ: 提案手法 上へ: 認識手法 戻る: マルチパス法   目次
平成24年3月20日