現状の音声ワードプロセッサなどの連続文音声認識では、認識単位 は音素もしくは音節であるため、出力も、ひらがなべた書き文、も しくはそれに類するものである [3][4][5]。しかし、これら の出力は、音声ワードプロセッサなど音声認識のあとに接続される 言語処理を考えると、日本語では漢字かなまじり文の出力が相応し いと思われる。しかし、現状では、漢字かなまじり文への変換は、 通常のワードプロセッサなどに使用されているかな漢字変換におい て見られるように、1文のひらがなべた書き文に対して、複数の漢 字かなまじり文が生成される。通常は言語処理で、これらの曖昧さ を絞り込んでいるが、音声は、音韻情報の他に韻律情報も持ってい るため、この情報を利用することによっても、これらの曖昧さを絞 り込むのに有効であると考えられる。
ところで、情報量は、その情報を利用したときに減らせる曖昧さの 値であると考えられる。
したがって、アクセント情報の持つ情報量は、音声認識システムが 音韻情報を完全に認識したと仮定して、この情報から生成される漢 字かなまじり文の数と、音声認識システムが音韻情報および韻律情 報を完全に認識したと仮定して、この情報から生成される漢字かな まじり文の数を比較することによって測定できる。具体的な方法を 次にしめす。