Parallel Model Combination法

次へ: マルチパス法 上へ: 本研究での認識手法 戻る: 単純法目次

Parallel Model Combination法

Parallel Model Combination法[4](以下PMC法)は，雑音が重畳した音声を認識する一般的な方法である．無雑音音声のHMMと雑音のHMMから目的の雑音環境の音声HMMを合成し，認識を行う手法である．

本研究では，雑音モデルをクロストーク音声の片側音声だと考え，男性話者の音素HMMと女性話者の音素HMMから PMC法のモデルを合成し認識を行う．

PMC法の各状態の尤度は，各状態に遷移されるパスの尤度の和をとる．モデルの尤度は，最終状態の尤度とする．最後に，最も尤度が高かったPMC法のモデルを認識結果とする．

図7にその様子を示す．

本研究では，PMC法のモデルは，音声を音素単位で考え，各モーラごとに子音と母音に分け，男性話者の子音と女性話者の子音で，男性話者の母音と女性話者の母音で相互にパスを持つPMC法のモデルを構築する．

図6に本研究でのPMC法のモデルを示す．

**図 6:** 本研究でのPMC法のモデル
$\includegraphics[scale=1.2]{pmc2.eps}$

図6は男性話者の音声に「朝日(asahi)」，女性話者の音声に「悲願(higaN)」を使用した場合の PMC法のモデルである．

**図 7:** 認識結果の求め方
$\includegraphics[scale=0.6]{ninsikikekka.eps}$

図7の例は,クロストーク音声の発話内容が,男性話者が「悪質(akusitsu)」,女性話者が「対策(taisaku)」だった場合,マルチパス法のモデルの尤度が最大のモデルも,男性話者が「悪質(akusitsu)」,女性話者が「対策(taisaku)」のモデルであり,クロストーク音声の発話内容と一致しており,この場合は正しく同時発話認識ができている．

平成19年5月7日