next up previous contents
次へ: HTKによるモデル作成 上へ: 認識実験 戻る: 実験データ   目次

実験手順

クロストーク音声認識の流れを図15に示す.
図: クロストーク音声認識の流れ
\fbox{\includegraphics[width=7cm]{nagare4.eps}}

(1)
認識に使用する単語として選んだ男性話者,女性話者それぞれ10単語を重ね合わ せて,100単語のクロストーク音声を作成する.なお,選んだ単語 は表1に載せる.作成したクロストーク音声の例 を表2に載せる.
(2)
HMMを,「1state 1mixture」と「3state 4mixture」の条件で作成する.
PMC法では,「1state 1mixture」「1state 4mixture」の条件で作成する.


(3)
男性HMMと女性HMMを用いて,合成HMMを作る.合成方法は,特徴パラメータFBANKでは,混合分布の加算を,特徴パラメータMFCC_Eでは,パラメータ合成を行う.
(4)
クロストーク音声100個のモデルを作る.詳細は,次章のHTKによるモデル作成において説明する.
(5)
クロストーク音声に対して,100個のモデルを使い,HTKにより認識を行う. 100個の入力音声に100個のモデルで認識結果を出し,各入力音声で,尤度のソートを行い,認識率を求める. 提案手法とマルチパス法において,ソートして認識率を出した結果を付録1,2に示す. 「悪質+足元」,「悪質+可愛い」,「悪質+勤勉」の3例の認識結果を付録4,5,6にそれぞれ示す.



平成24年3月20日