next up previous contents
次へ: 木に基づく状態共有 上へ: 考察 戻る: アクセント情報とモーラ情報   目次

FBANKとMFCC

不特定話者のほとんどの実験結果において, FBANKの同音異義語認識精度はMFCC と 比べて低い. しかし, 特定話者においてFBANK を用いた同音異義語認識精度は MFCCと比べ高い. FBANKはMFCCより話者とモデルの依存度が高い結果となっている.

本研究では, 評価する話者以外の多数の話者のデータを学習データとして用いてい る. しかし, FBANKは話者を特徴付ける韻律情報を含んでおり, 多数の韻律情報の 学習によって特徴が平滑化されると認識に有効ではないと考える. 本研究で用いた 手法以外の不特定話者のモデル作成方法には, 多数のモデルを作成しておき評価デー タから最適なモデルを選択する話者選択手法や, モデルを評価データに適合させる 話者適合手法がある. 話者選択や話者適合手法を用いればFBANKにおいて韻律情報 を有効に利用し,不特定話者の認識精度を特定話者の認識精度に近付けることがで きると考えられる. そして, 特定話者においてMFCCより認識精度が高いFBANKは, 不特定話者の認識精度を向上させる手法を用いると, 不特定話者の認識においても 有効であると考えている.



平成18年3月20日