本研究では,従来の音声認識においてあまり行われてこなかった不特定話者に おける同音異義語の音声認識精度を調査した.同音異義語を音声認識するため に,ピッチ周波数を抽出するのではなく,アクセントを音素ラベルに付与した モデルを提案した.そして,同一発話内容でアクセントが異なる同音異義語対 に対して,音声認識率を調査した.音響パラメータにはMFCCとFBANKを利用して 認識を行った.不特定話者における同音異義語音声認識の実験結果より以下を 確認した.
今後,不特定話者における同音異義語の認識精度を高める手法として,特定話 者と女性話者で効果が見られたFBANKを用いること,そのために話者適応手法や 話者選択手法を用いることが考えられる.