次へ: 単語音声認識に対する考察
上へ: 同音異義語の認識結果に対する考察
戻る: 同音異義語の誤認識
目次
半連続型HMMでの単語を同音異義語に誤認識した割合を表51, 状
態共有型HMMでの単語を同音異義語に誤認識した割合を表52に示
す. 表51の括弧内の分母は, 表14,
15, 16, 17での6話者の同音異義語の誤り
数である. また, 表52の括弧内の分母は, 表
18, 19での6話者の同音異義語の誤り数であ
る. 表51, 52の括弧内の分子は同音異義語を
別のアクセントの同音異義語に誤認識した数を示す.
アクセントtriphoneモデルにおいて, 単語を同音異義語以外の単語に誤認識し
た割合は平均39%(74/188)であり, アクセントモデルの51%(101/200)と比べて低
い. アクセントモデルの前後音素環境を考慮することによって, 単語音声認識精度
が向上したためだと考えられる. 同音異義語ではない別の単語に誤認識した例を表
53に示す.
なお, 特定話者の半連続型HMMにおいて, アクセントtriphoneモデルの認識精度は
, アクセントモデルより低い. アクセントtriphoneモデルにおいてHMMのパラメー
タ数が膨大となり, 学習データが不足するためだと考えられる.
表 51:
半連続型HMMでの単語を同音異義語に誤認識した割合
|
アクセント |
アクセント |
|
モデル |
triphoneモデル |
Diagonal MFCC |
61%(19/31) |
84%(22/26) |
Diagonal FBANK |
66%(21/32) |
71%(20/28) |
Full MFCC |
50%(12/24) |
79%(11/14) |
Full FBANK |
54%(13/24) |
81%(17/21) |
平均 |
59%(65/111) |
79%(70/89) |
表 52:
状態共有型HMMでの単語を同音異義語に誤認識した割合
|
アクセント |
アクセント |
|
モデル |
triphoneモデル |
Diagonal MFCC |
31%(14/45) |
49%(22/45) |
Diagonal FBANK |
45%(20/44) |
41%(22/54) |
平均 |
38%(34/89) |
44%(44/99) |
表 53:
単語を同音異義語ではない単語とした誤認識例
認識結果 |
正解 |
徳(01) |
置く(01) |
堪える(010) |
返る(100) |
勤勉(0111) |
機嫌(011) |
酔う(10) |
夜(10) |
解く(10) |
億(10) |
生える(010) |
代える(011) |
悲劇(100) |
機嫌(011) |
次へ: 単語音声認識に対する考察
上へ: 同音異義語の認識結果に対する考察
戻る: 同音異義語の誤認識
目次
平成18年3月20日