話者 | 本研究の手法の | 従来の手法の |
認識率(教師あり) | 認識率 | |
mau | 85.15% (2231/2620) | 85.38% (2237/2620) |
mmy | 77.75% (2037/2620) | 85.88% (2250/2620) |
mnm | 72.86% (1909/2620) | 86.11% (2256/2620) |
faf | 78.78% (2064/2620) | 87.79% (2300/2620) |
fms | 79.35% (2079/2620) | 84.69% (2219/2620) |
ftk | 80.57% (2111/2620) | 84.77% (2221/2620) |
各話者の認識率を比較しても,本研究の手法が従来の手法より認識率が低い結果 となっている. 結果より,不特定話者音声認識では話者選択の手法で行った音質の似ている話者 のHMMを使って認識するよりも,学習データ量が多いHMMを使って認識する方が有 効であるといえる. 本研究で行った音質の似ている話者を選択する方法だけでは,従来の手法を超え ることは困難と考えられる.よって今後は,話者適応などを組み合わせることに より,認識率を向上させる必要がある.