next up previous contents
次へ: 単語音声認識に対する考察 上へ: 同音異義語の認識結果に対する考察 戻る: 同音異義語の誤認識   目次

単語の誤認識

半連続型HMMでの単語を同音異義語に誤認識した割合を表51, 状 態共有型HMMでの単語を同音異義語に誤認識した割合を表52に示 す. 表51の括弧内の分母は, 表14, 15, 16, 17での6話者の同音異義語の誤り 数である. また, 表52の括弧内の分母は, 表 18, 19での6話者の同音異義語の誤り数であ る. 表51, 52の括弧内の分子は同音異義語を 別のアクセントの同音異義語に誤認識した数を示す.

アクセントtriphoneモデルにおいて, 単語を同音異義語以外の単語に誤認識し た割合は平均39%(74/188)であり, アクセントモデルの51%(101/200)と比べて低 い. アクセントモデルの前後音素環境を考慮することによって, 単語音声認識精度 が向上したためだと考えられる. 同音異義語ではない別の単語に誤認識した例を表 53に示す.

なお, 特定話者の半連続型HMMにおいて, アクセントtriphoneモデルの認識精度は , アクセントモデルより低い. アクセントtriphoneモデルにおいてHMMのパラメー タ数が膨大となり, 学習データが不足するためだと考えられる.


表 51: 半連続型HMMでの単語を同音異義語に誤認識した割合
アクセント アクセント
モデル triphoneモデル
Diagonal MFCC 61%(19/31) 84%(22/26)
Diagonal FBANK 66%(21/32) 71%(20/28)
Full MFCC 50%(12/24) 79%(11/14)
Full FBANK 54%(13/24) 81%(17/21)
平均 59%(65/111) 79%(70/89)


表 52: 状態共有型HMMでの単語を同音異義語に誤認識した割合
アクセント アクセント
モデル triphoneモデル
Diagonal MFCC 31%(14/45) 49%(22/45)
Diagonal FBANK 45%(20/44) 41%(22/54)
平均 38%(34/89) 44%(44/99)


表 53: 単語を同音異義語ではない単語とした誤認識例
認識結果 正解
徳(01) 置く(01)
堪える(010) 返る(100)
勤勉(0111) 機嫌(011)
酔う(10) 夜(10)
解く(10) 億(10)
生える(010) 代える(011)
悲劇(100) 機嫌(011)


next up previous contents
次へ: 単語音声認識に対する考察 上へ: 同音異義語の認識結果に対する考察 戻る: 同音異義語の誤認識   目次
平成18年3月20日