next up previous contents
次へ: Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討 上へ: 音声におけるアクセント情報の持つ情報量の考察 戻る: 音声認識におけるアクセント情報の持つ情報量   目次

まとめ

本章では、日本語の音声の韻律情報の中から、アクセント句境界 の位置および第1アクセント核の位置の持つ情報量を定量的に測定 した。これらの情報量は、音素情報を漢字変換したときに生成され る漢字仮名交じり文の数と、音素情報とアクセント情報を漢字変換 したときに生成される漢字仮名交じり文の数を比較することによっ て得た。ただし実験では、漢字仮名交じり文を音素情報およびアク セント情報に変換する漢字ー音素・アクセント変換を利用して、近 似的に同等と考えられる方法で、実験をおこなった。

この実験によれば、アクセント句境界の位置と第1アクセント核の位 置を合わせた情報量は 5.16bitであった。一方、日本語における音素 情報の平均情報量は音節あたり 5.67bit程度である。すなわち、アク セント情報の情報量は、かなり大きい情報量であると思われる。

本章では、韻律情報の中からアクセント句境界の位置および第1 アクセント核の位置に焦点をあてたが、韻律には、その他アクセン ト境界の長さの情報や第2アクセント核などの多くの情報がある。 したがって、全韻律情報の情報量は、上で示した値より大きいこと が予想される。これらの情報は、方言などの個人差が大きいことや、 信号処理により検出することは容易でないため、断片的な情報しか 得られない可能性はあるが、それでもなお音声認識に有効な情報を 含む可能性があると思われる。



Jin'ichi Murakami 平成13年1月5日