next up previous
次へ: 文献目録 上へ: 日本語の同音異義語の認識 1 戻る: 男性話者と女性話者

おわりに

本研究では,従来の音声認識においてあまり行われてこなかった不特定話者に おける同音異義語の音声認識精度を調査した.同音異義語を音声認識するため に,ピッチ周波数を抽出するのではなく,アクセントを音素ラベルに付与した モデルを提案した.そして,同一発話内容でアクセントが異なる同音異義語対 に対して,音声認識率を調査した.音響パラメータにはMFCCとFBANKを利用して 認識を行った.不特定話者における同音異義語音声認識の実験結果より以下を 確認した.

  1. アクセントtriphoneモデルにおいて音響パラメータにMFCCを利用し,共分 散行列にFull Covarianceのとき,同音異義語対11組22単語において89% の同音異義語音声認識の精度が得られた.

  2. 平均値で見たとき,MFCCの認識精度はFBANKより低い.しかし男性 話者ではMFCCのほうが有効であったのに対し,女性話者ではFBANKのほう が有効であった.

  3. 話者において認識精度に大きな差がある.

今後,不特定話者における同音異義語の認識精度を高める手法として,特定話 者と女性話者で効果が見られたFBANKを用いること,そのために話者適応手法や 話者選択手法を用いることが考えられる.



Jin'ichi Murakami 平成21年10月7日