next up previous contents
次へ: 考察 上へ: 実験 戻る: 実験条件   目次

実験結果


2に特定話者(学習データと評価データが同一話者)におけ る単語音声認識の実験結果を示す.表中の行は話者,列は特徴量である.

表 2: 実験結果1(単語認識率 [%])
 特徴量\話者   mau   mms   mxm   faf   ftk   fyn  
 MFCC(14次元)   94.50   92.44   91.56   93.02   93.66   92.37  
 FFTpower(256次元)   88.89   86.03   85.99   89.01   81.91   86.68  
 LFCC(64次元)   92.06   89.16   88.82   89.05   86.49   88.89  
 FFT_Real_Img   85.42   82.21   80.84   83.05   79.20   84.73  
 (256+256次元)                          
 FFTpower                          
 +FFT_Real_Img   86.91   84.62   84.47   86.37   80.15   86.11  
 (256+256+256次元)                          


実験結果から,本研究で提案した位相情報を利用した特徴量(FFT_Real_Img)を 用いた場合,従来 の特徴量に比べて認識精度の向上は見られない.特に,パワースペクトル (FFTpower)とFFT_Real_Imgを比べると認識率が減少している点が問題である. この二手法に着目した結果を図9に示す.

図 9: 実験結果2(提案手法とパワースペクトルを比較した単語認識率[%])
\includegraphics[width=110mm]{result2.eps}

この図から,FFTpowerの結果に対して提案した特徴量,そして両者を併用した場 合,いずれにしても精度が低下していることが分かる.この二つの特徴量につい ては,本質的な情報量の差がないため,同程度以上の結果が得られると考えてい た.次章にて結果の分析を行う.


next up previous contents
次へ: 考察 上へ: 実験 戻る: 実験条件   目次
平成25年10月13日