next up previous
次へ: 基本的な測定方法のフローチャート 上へ: アクセント情報の持つ情報量の基本的な測定方法 戻る: アクセント情報の持つ情報量の基本的な測定方法

基本的な測定方法

現状の音声ワードプロセッサなどの連続文音声認識では、認識単位 は音素もしくは音節であるため、出力も、ひらがなべた書き文、も しくはそれに類するものである [3][4][5]。しかし、これら の出力は、音声ワードプロセッサなど音声認識のあとに接続される 言語処理を考えると、日本語では漢字かなまじり文の出力が相応し いと思われる。しかし、現状では、漢字かなまじり文への変換は、 通常のワードプロセッサなどに使用されているかな漢字変換におい て見られるように、1文のひらがなべた書き文に対して、複数の漢 字かなまじり文が生成される。通常は言語処理で、これらの曖昧さ を絞り込んでいるが、音声は、音韻情報の他に韻律情報も持ってい るため、この情報を利用することによっても、これらの曖昧さを絞 り込むのに有効であると考えられる。

ところで、情報量は、その情報を利用したときに減らせる曖昧さの 値であると考えられる。

したがって、アクセント情報の持つ情報量は、音声認識システムが 音韻情報を完全に認識したと仮定して、この情報から生成される漢 字かなまじり文の数と、音声認識システムが音韻情報および韻律情 報を完全に認識したと仮定して、この情報から生成される漢字かな まじり文の数を比較することによって測定できる。具体的な方法を 次にしめす。

  1. 音声認識システムが音韻情報を完全に認識したと仮定して、 この音韻情報を利用して漢字変換を行い、漢字かなまじり文を生成する。
  2. 音声認識システムが音韻情報および韻律情報を完全に認識 したと仮定して、 この音韻情報およびアクセント情報を利用して漢字変換をおこない、 漢字かなまじり文を生成する。
  3. 両方の漢字かなまじり文の数の比を計算する。



Jin'ichi Murakami 平成13年10月5日