実験手順

次へ: HTKによるモデル作成 上へ: 認識実験 戻る: 実験データ目次

クロストーク音声認識の流れを図15に示す．

図: クロストーク音声認識の流れ
$\fbox{\includegraphics[width=7cm]{nagare4.eps}}$

(1): 認識に使用する単語として選んだ男性話者，女性話者それぞれ10単語を重ね合わせて，100単語のクロストーク音声を作成する．なお，選んだ単語は表1に載せる．作成したクロストーク音声の例を表2に載せる．
(2): HMMを，「1state 1mixture」と「3state 4mixture」の条件で作成する．
PMC法では，「1state 1mixture」「1state 4mixture」の条件で作成する．
(3): 男性HMMと女性HMMを用いて，合成HMMを作る．合成方法は，特徴パラメータFBANKでは，混合分布の加算を，特徴パラメータMFCC_Eでは，パラメータ合成を行う．
(4): クロストーク音声100個のモデルを作る．詳細は，次章のHTKによるモデル作成において説明する．
(5): クロストーク音声に対して，100個のモデルを使い，HTKにより認識を行う． 100個の入力音声に100個のモデルで認識結果を出し，各入力音声で，尤度のソートを行い，認識率を求める．提案手法とマルチパス法において，ソートして認識率を出した結果を付録1，2に示す．「悪質+足元」，「悪質＋可愛い」，「悪質＋勤勉」の３例の認識結果を付録4，5，6にそれぞれ示す．

平成24年3月20日