next up previous contents
次へ: マルチパス法 上へ: 本研究での認識手法 戻る: 単純法   目次

Parallel Model Combination法

Parallel Model Combination法[4](以下PMC法)は, 雑音が重畳した音声を認識する一般的な方法である.無雑音音声のHMMと 雑音のHMMから目的の雑音環境の音声HMMを合成し,認識を行う手法である.

本研究では,雑音モデルをクロストーク音声 の片側音声だと考え,男性話者の音素HMMと女性話者の音素HMMから PMC法のモデルを合成し認識を行う.

PMC法の各状態の尤度は,各状態に遷移されるパスの尤度の和をとる. モデルの尤度は,最終状態の尤度とする. 最後に,最も尤度が高かったPMC法のモデルを認識結果とする.

7にその様子を示す.

本研究では,PMC法のモデルは,音声を音素単位で考え, 各モーラごとに子音と母音に分け, 男性話者の子音と女性話者の子音で,男性話者の母音と女性話者の母音で 相互にパスを持つPMC法のモデルを構築する.

6に本研究でのPMC法のモデルを示す.



図 6: 本研究でのPMC法のモデル
\includegraphics[scale=1.2]{pmc2.eps}

6は男性話者の音声に「朝日(asahi)」, 女性話者の音声に「悲願(higaN)」を使用した場合の PMC法のモデルである.

図 7: 認識結果の求め方
\includegraphics[scale=0.6]{ninsikikekka.eps}




7の例は,クロストーク音声の発話内容が,男性話者が「悪質(akusitsu)」,女性話者が「対策(taisaku)」 だった場合,マルチパス法のモデルの尤度が最大のモデルも,男性話者が「悪質(akusitsu)」,女性話 者が「対策(taisaku)」のモデルであり,クロストーク音声の発話内容と一致しており,この場合 は正しく同時発話認識ができている.



平成19年5月7日