next up previous contents
次へ: 本研究におけるマルチパス法 上へ: 認識手法 戻る: 従来のPMC法   目次

本研究におけるPMC法

本研究では,パラメータ合成を行わず未完成で ある.雑音モデルをクロストーク音声の片側音声だと考え,音声を音素単 位として,男性話者の音素HMMと女性話者の音素HMMから,PMC法のモデルを合成 し認識を行う.モデルは図9のように,各話者のHMMを音素単位で考えて,作 成する.各話者のモーラ目ごとに,男性話者の子音と女性話者の子音,男性話者 の母音と女性話者の母音で相互にパスを繋ぐ.各状態の尤度は各状態に遷移され るパスの尤度の和をとる.なお,モーラは日本語の音素単位に相当する. また,図10にグリッドでのパスを繋いだ図を示す.

図 9: PMC(マルチパス)法の状態遷移図
\fbox{\includegraphics[width=14cm,clip]{pmc131.eps}}
図 10: PMC法(グリッド)

各状態の尤度は、各状態に遷移されるパスの尤度の和をとることから、 「asahi」と「higaN」のそれぞれのモデルにおいて、前章のforwardアルゴリズムの グリッド(図4)を並べ、パスを交換し合った図である。フレームは 入力音声のフレームである. 1個の音声に対して複数の候補の単語の尤度を求め, 一番高い単語が認識結果になる.具体的には,1個のクロストーク音声に対して,男性話者10単語女性話者10単語により,作成した100個のモデルの尤度を出し,一番高い組 合せのモデルが認識結果になる.

11に本実験で行う例を示す.

図 11: PMC法の認識結果の求め方
\fbox{\includegraphics[width=12cm,clip]{pp.eps}}

発話内容が「悪質+対策」に対し て100個のモデルの尤度を出し,順位付けしたのが下の表で, 1位の「悪質」「対策」が認識結果になる.この例は同時発話認識できている.


平成20年5月16日