next up previous contents
次へ: 実験条件 上へ: 評価実験 戻る: 評価実験   目次

評価データと学習データ

9にクロストーク音声認識の手順を示す. 本研究では,実際に男女2話者が同時に発話した音声を使用せず, 各々の話者の音声を重畳した音声を作成する. 具体的には,ATR単語発話データベースAset の男性話者mau,mms及び女性話者ftk,fynの男女各2名を使用する.

偶数番号の音声の中から4モーラで発話時間がほぼ同じ語を,ランダムに10単語ずつ抽出する. それぞれを相互に重畳した音声(クロストーク音声)を100個作成する. 1セットにつき100単語のクロストーク音声を 4セット作成し, 評価データとして利用する. 表3に実験に使用した単語を示す.

ATR単語発話データベースAsetの奇数番号の2620単語の音声は HMMの学習データとして使用する.

10に音素HMMの作成と学習及び認識の流れを示す. 音素HMMの作成と学習は,HTKで行う. まず最初に,男性話者と女性話者の初期モデルの作成を行う. 次に,学習データを使用して,男性話者と女性話者HMMの学習及び連結学習を行 う.最後に学習された男性話者と女性話者HMMを利用して,Viterbiアルゴリズム とForwardアルゴリズムを使用し認識を行う.






表 3: 実験に使用した単語
  男性話者 女性話者
1 悪質(akushitsu) 足元(ashimoto)
2 聞こえる(kikoeru) 可愛い(kawaii)
3 加える(kuwaeru) 勤勉(kiNbeN)
4 失恋(shitsureN) 細々(komagoma)
5 優れる(sugureru) すまない(sumanai)
6 そのうち(sonouchi) 対策(taisaku)
7 中毒(chuudoku) 手拭い(tenugui)
8 内容(naiyou) 天才(teNsai)
9 暴力(bouryoku) 滅ぼす(horobosu)
10 わざわざ(wazawaza) 欲張る(yokubaru)

図 9: クロストーク音声認識の手順
\includegraphics[scale=1.0]{nagare7.eps}

図 10: 音素HMMの作成と学習及び認識の流れ
\includegraphics[scale=0.6]{sakusei.eps}



平成19年5月7日