next up previous contents
次へ: 単語のHMMとbigramを利用した文節音声認識 上へ: trigramの有効性について 戻る: 考察   目次

まとめ

日本文音声認識において音声の物理的特性を使用した音声認識装置と自然言 語処理の間を結ぶ処理として、trigramを用いた文節処理の2つの方法(音節 選出型と直接選出型)を提案し、その効果を実験的に求めた。

その結果、両方の方式とも、漢字かな混じりの文節候補を従来の音節の trigramを用いた文節候補で得られた正解率と同じか、それ以上の精度で、 生成できることが分かった。これは、漢字かなのtrigramの効果は非常に効 果的で、大語彙辞書を用いて、音節から漢字かな混じり文を生成する際に生 じる膨大な曖昧性がほぼ完全に解消することを意味している。

音節選出型と直接選出型の文節処理を比べると、音節の文節候補の第1位正 解率は、後者の精度が若干高いが両者に大きな差異は認められないことから、 音節のtrigramには単語内の音節のtrigramの情報がかなり反映されており、 音節における文節候補の推定の能力の点でみれば、音節間のtrigramは単語 辞書に代わり得る情報を持つことが推定される。また漢字かなの文節候補で は直接選出型の方が精度は高い。これは漢字かなのtrigramはかなり大きな 情報量を持っているため、単語の候補が増加しても、これが文節候補の推定 に影響を与えていないことがわかる。

text-closed dataとtext-open dataの場合の比較では両者の差は音節、漢字 かなに比べて品詞では差がなかった。このことから、品詞のtrigramは前2 者に比べて小量のデータで収束することが分かるが、これは同時に候補絞り 込みに使用される情報量が少ないことも意味しており、実験では文節絞り込 みの精度は最も小さくなっている。

本章では、大語彙の音声認識におけるマルコフモデルの効果を見る立場から、 音声認識装置からの認識距離は使用せず、音節、漢字かな、品詞それぞれの trigramの効果について研究した。したがって今後、これらの情報を組合せ た場合について検討する必要がある。

また、本章では対象外としたが、今後、音声認識部における脱落、挿入など を含むセグメンテーションの誤りの問題や、文節候補の曖昧性をさらに絞り 込むための、文節間文法情報や意味、文脈等情報等の適用方法の検討、また、 text-closed dataにおいて連鎖値が0.0である場合の値の定め方等の検討が必 要である。



Jin'ichi Murakami 平成13年1月5日