次へ: 謝辞
上へ: pap
戻る: PMC法
目次
本研究は,クロストーク音声認識において,3次元ビタビ探索を用いたモデルにより認識を行う手法を提案した.
提案手法は,男女2話者のHMMが男女2話者の音声がスペクトル領域で加算の関係にあるという仮定を立て,スペクトル領域での混合分布の加算を行った.
結果は,特徴パラメータにFBANKを用いたときに13.0%となり,マルチパス法による結果の39.5%に比べ低い結果となった.
認識率が低い原因として,2点を考えている.1点目は,仮定の間違いの可能性である.実際はスペクトル領域で乗算の関係の可能性があり,今後は特徴パラメータを変更してその可能性を調査する.2点目は,HMMの状態数が3の場合に,男女2話者のHMMが同時に遷移するとしたために,男女2話者の音素が別の動きをしても対応できない点である.今後は,男女2話者の音素間で遷移しうるすべてのパスを考慮したモデルを作成する予定である.
また,PMC法による結果は,最大で10%となり,同じ条件によるマルチパス法の結果の48%に比べ低い結果となった.PMC法も同じ仮定で行われているが,同じく低い結果になったので,今後は,従来のPMC法を行うために,音声と雑音を用いた実験を行う予定である.
平成24年3月20日