next up previous contents
次へ: 3次元ビタビ探索 上へ: 提案手法 戻る: 提案手法   目次

従来の認識手法の問題点

クロストーク音声認識をする上で,重畳した音声を認識する際,フレーム単位で男性女性両方のHMMで計算する必要がある.しかし,従来の認識手法は,どちらか一方のHMMで計算する.単純法は,話者ごとに認識を行うために,その話者のHMMで計算するため,問題がある.また,マルチパス法は,状態の尤度を各状態に遷移されるパスの尤度の最大値とするため,時間単位では,どちらかのHMMを計算する.

そこで,過去の研究では,雑音対策の認識手法であるPMC法の適用が提案されている[2].音声と雑音がスペクトル領域で加算の関係にあるという前提条件から,雑音を女性音声と考えることで,適用できると考えられた.実際には,特徴パラメータMFCCにおいて,ケプストラ厶をスペクトル領域にして加算し元に戻すことで,両方のHMMで計算できる.本研究では,「スペクトル領域で男性の音声と女性の音声は加算の関係である」という仮定を立て,男女の状態数混合分布数をスペクトル領域で加算する手法を提案する. 1状態に男女のHMMを用いるために,男女のHMMを交差させ,二次元に考え,時間とあわせて3次元ビタビ探索を行う.



平成24年3月20日