4.3.2.1節および 4.3.2.2節に示すような改良をして、 文認識実験を行なった。この実験結果を表 4.9 に載せる。これからわかるように認識性能 が向上する。特に不特定話者認識においては効果が著しい。特定話者認識にお ける誤認識の例を表4.10に載せる。これからわかるよ うに、誤認識された文には意味的に合っている文が多い。意味的に正しい文を 正解に含めたとき1位理解率は99%に達した。
これらの実験から、誤認識の原因になっているポーズの対策として、言語モデ ルではポーズのスキップ、音響モデルではポーズのHMMを学習することが有効 であることが示された。
言語model | bigram | trigram | |||
特定話者 | 不特定話者 | 特定話者 | 不特定話者 | ||
累積文認識率 | 60.5% | 44.8% | 90.4% | 83.9% | |
68.2% | 51.0% | 95.4% | 92.7% | ||
76.2% | 55.6% | 97.7% | 96.6% | ||
word correct | 87.2% | 72.4% | 97.6% | 96.2% | |
word accuracy | 79.6% | 58.3% | 97.1% | 95.7% |
正解文 → 1位出力 |
京都プリンスホテルが会議場には近いのですが |
→ 京都プリンスホテルが会議場には近いんですが |
ご住所とお名前をお願いします |
→ ご住所とお名前お願いします |
ではお名前とご住所をお願いします |
→ ではお名前とお住所をお願いします |
どのようなご用件でしょうか |
→ どのような用件でしょうか |
失礼します |
→ そうします |
言語学や心理学を専攻する方にも参加していただく予定です |
→ 言語学や心理学を専攻する方にご参加してあるというんです |