次へ: HTKによるモデル作成
上へ: 認識実験
戻る: 実験データ
目次
クロストーク音声認識の流れを図15に示す.
- (1)
- 認識に使用する単語として選んだ男性話者,女性話者それぞれ10単語を重ね合わ
せて,100単語のクロストーク音声を作成する.なお,選んだ単語
は表1に載せる.作成したクロストーク音声の例
を表2に載せる.
- (2)
- HMMを,「1state 1mixture」と「3state 4mixture」の条件で作成する.
PMC法では,「1state 1mixture」「1state 4mixture」の条件で作成する.
- (3)
- 男性HMMと女性HMMを用いて,合成HMMを作る.合成方法は,特徴パラメータFBANKでは,混合分布の加算を,特徴パラメータMFCC_Eでは,パラメータ合成を行う.
- (4)
- クロストーク音声100個のモデルを作る.詳細は,次章のHTKによるモデル作成において説明する.
- (5)
- クロストーク音声に対して,100個のモデルを使い,HTKにより認識を行う.
100個の入力音声に100個のモデルで認識結果を出し,各入力音声で,尤度のソートを行い,認識率を求める.
提案手法とマルチパス法において,ソートして認識率を出した結果を付録1,2に示す.
「悪質+足元」,「悪質+可愛い」,「悪質+勤勉」の3例の認識結果を付録4,5,6にそれぞれ示す.
平成24年3月20日