next up previous contents
次へ: 教師ありと教師なしの話者選択の比較 上へ: 考察 戻る: 考察   目次

従来の手法と比較

実験の結果,男女20人の平均の認識率の中で最も高い認識率は,教師ありの話者 選択で共分散行列にDiagonalを使った場合において79.21%となった.従来の 手法のDiagonalを使った場合の認識率は85.77%となっており,本研究の手法の結果は 従来の手法より低い結果となった. また,話者ごとに認識率を比較するために,表12に話者ごとの従来の手 法と本研究の手法の認識率を示す.
表 12: 本研究の手法と従来の手法の認識率(FBANK,Diagonal)
話者 本研究の手法の 従来の手法の
  認識率(教師あり) 認識率
mau 85.15% (2231/2620) 85.38% (2237/2620)
mmy 77.75% (2037/2620) 85.88% (2250/2620)
mnm 72.86% (1909/2620) 86.11% (2256/2620)
faf 78.78% (2064/2620) 87.79% (2300/2620)
fms 79.35% (2079/2620) 84.69% (2219/2620)
ftk 80.57% (2111/2620) 84.77% (2221/2620)

各話者の認識率を比較しても,本研究の手法が従来の手法より認識率が低い結果 となっている. 結果より,不特定話者音声認識では話者選択の手法で行った音質の似ている話者 のHMMを使って認識するよりも,学習データ量が多いHMMを使って認識する方が有 効であるといえる. 本研究で行った音質の似ている話者を選択する方法だけでは,従来の手法を超え ることは困難と考えられる.よって今後は,話者適応などを組み合わせることに より,認識率を向上させる必要がある.



平成18年3月20日