本研究では,雑音モデルをクロストーク音声 の片側音声だと考え,男性話者の音素HMMと女性話者の音素HMMから PMC法のモデルを合成し認識を行う.
PMC法の各状態の尤度は,各状態に遷移されるパスの尤度の和をとる. モデルの尤度は,最終状態の尤度とする. 最後に,最も尤度が高かったPMC法のモデルを認識結果とする.
図7にその様子を示す.
本研究では,PMC法のモデルは,音声を音素単位で考え, 各モーラごとに子音と母音に分け, 男性話者の子音と女性話者の子音で,男性話者の母音と女性話者の母音で 相互にパスを持つPMC法のモデルを構築する.
図6に本研究でのPMC法のモデルを示す.
図6は男性話者の音声に「朝日(asahi)」, 女性話者の音声に「悲願(higaN)」を使用した場合の PMC法のモデルである.
図7の例は,クロストーク音声の発話内容が,男性話者が「悪質(akusitsu)」,女性話者が「対策(taisaku)」
だった場合,マルチパス法のモデルの尤度が最大のモデルも,男性話者が「悪質(akusitsu)」,女性話
者が「対策(taisaku)」のモデルであり,クロストーク音声の発話内容と一致しており,この場合
は正しく同時発話認識ができている.