実験結果を表4, 5, 6, 7 に示す.表中のmau,mmy,mnmは男性話者であり,faf,fms,ftkは女性話者である.表 4は,音響パラメータにMFCC,共分散行列にDiagonal Covariance を用いた同音異義語の誤り率,表5は,音響パラメータにFBANK, 共分散行列にDiagonal Covarianceを用いた同音異義語の誤り率,表 6は,音響パラメータにMFCC,共分散行列にFull Covarianceを用 いた同音異義語の誤り率,表7は,音響パラメータにFBANK,共分 散行列にFull Covarianceを用いた同音異義語の誤り率,の結果である.
実験より以下の結果を得た.
同音異義語の平均認識率は,HMMにアクセントtriphoneモデル,音響パ ラメータにMFCC,共分散行列にFull Covarianceを用いた実験において, 最も高い値,平均89%が得られた(表6).しかし,男性話者の平均と女性話者 の平均では,音響パラメータによって結果が異なる.男性話者の平均で は,HMMにアクセントtriphoneモデル,音響パラメータにMFCC,共分散 行列にFull Covariance を用いた実験で,認識精度92%が得られた(表6).女 性話者の平均では,HMMにアクセントtriphoneモデル,音響パラメータ にFBANK,共分散行列にFull Covariance を用いた実験で,認識精度 94%が得られた(表7).
男性と女性を比較すると,女性話者のほうが認識率は高い.しかし男性 話者においては,MFCCはFBANKより認識率が高い.しかし逆に女性話者 においては,FBANKはMFCCより認識率が高い.
平均の認識率をみると,MFCCはFBANKより同音異義語の認識精度がわず かに高いが差は小さい.また,男性話者はMFCCが有効であるのに対し, 女性話者ではFBANKが有効である.
どの実験条件においても,話者によって認識率が大きく異なる.例えば, HMMにアクセントtriphoneモデル,音響パラメータにFBANK,共分散行列 にFull Covariance を用いた実験では,fmsの認識率は100%であったの に対し,fafの認識率は91%であった(表7).
多くの場合,アクセントtriphoneモデルの方がアクセントモデルより同 音異義語の認識率は高い.しかし,認識率が大きく改善されるのは,音 響パラメータがMFCCで共分散行列がFull Covarianceの男性話者のとき である.(誤り率が23%から8% に改善された(表6). その他の実験では,大きな差はない.