next up previous contents
次へ: 各種パラメータの検討 上へ: ポーズの処理 戻る: ポーズのHMMの学習(音響モデルにおける処理)   目次

ポーズ処理をしたときの実験の結果

4.3.2.1節および 4.3.2.2節に示すような改良をして、 文認識実験を行なった。この実験結果を表  4.9 に載せる。これからわかるように認識性能 が向上する。特に不特定話者認識においては効果が著しい。特定話者認識にお ける誤認識の例を表4.10に載せる。これからわかるよ うに、誤認識された文には意味的に合っている文が多い。意味的に正しい文を 正解に含めたとき1位理解率は99%に達した。

これらの実験から、誤認識の原因になっているポーズの対策として、言語モデ ルではポーズのスキップ、音響モデルではポーズのHMMを学習することが有効 であることが示された。


表 4.9: 認識実験の結果(ポーズのスキップ、ポーズ学習) 文認識率(%)
言語model   bigram trigram
    特定話者 不特定話者 特定話者 不特定話者
累積文認識率 $1$ 60.5% 44.8% 90.4% 83.9%
  $\sim2$ 68.2% 51.0% 95.4% 92.7%
  $\sim8$ 76.2% 55.6% 97.7% 96.6%
word correct   87.2% 72.4% 97.6% 96.2%
word accuracy   79.6% 58.3% 97.1% 95.7%

text-closed; ビーム幅:4,096; $\alpha $:1



text-closed; ビーム幅:4,096; $\alpha $:1

表 4.10: 実験において誤りが出力された文 (ポーズのスキップ、ポーズ学習)
正解文 → 1位出力
京都プリンスホテルが会議場には近いのですが
→ 京都プリンスホテルが会議場には近いですが
ご住所とお名前をお願いします
→ ご住所とお名前お願いします
ではお名前とご住所をお願いします
→ ではお名前と住所をお願いします
どのようなご用件でしょうか
→ どのような用件でしょうか
失礼します
そうします
言語学や心理学を専攻する方にも参加していただく予定です
→ 言語学や心理学を専攻する方にご参加してあるというんです


next up previous contents
次へ: 各種パラメータの検討 上へ: ポーズの処理 戻る: ポーズのHMMの学習(音響モデルにおける処理)   目次
Jin'ichi Murakami 平成13年1月5日