next up previous
次へ: 文献目録 上へ: main3 戻る: 音声認識におけるアクセント情報の持つ情報量

むすび

本報告では、韻律情報を利用した文音声認識の研究の予備的な研究 として、日本語の音声の韻律情報の中から、アクセント句境界の位 置および第1アクセント核の位置について、これらアクセント情報 の持つ情報量を定量的に測定した。アクセント情報の情報量は、音 韻情報を漢字変換したときに生成される漢字かなまじり文の数と、 音韻情報とアクセント情報を漢字変換したときに生成される漢字か なまじり文の数を比較することによって得た。ただし本報告では、 漢字かなまじり文を音韻情報およびアクセント情報に変換する漢字 韻律変換を利用して、近似的に同等と考えられる方法で、実験をお こなった。

この実験によれば、アクセント句あたりのアクセント情報の持つ情 報量は 5.16bitであった。一方、日本語における音韻情報の平均情 報量は音節あたり 5.67bit程度であった。すなわち、アクセント句 あたりのアクセント情報の情報量は、音節あたりの音韻情報の平均 情報量に比較してほぼ同等程度と、かなり大きい情報量をもつこと がわかった。このことから、音声認識におけるアクセント情報の利 用は、極めて有効である可能性がある。

なお、本論文では、韻律情報の中からアクセント句境界の位置およ び第1アクセント核の位置に焦点をあてたが、韻律には、その他ア クセント境界の長さの情報や第2アクセント核などの多くの情報が ある。したがって、全韻律情報の情報量は、上で示した値より大き いことが予想される。これらの情報は、方言などの個人差が大きく、 また信号処理により検出することは容易でなく、断片的な情報しか 得られない可能性はあるが、それでもなお音声認識に有効な情報を 含むと思われる。

謝辞

本研究をすすめるにあたり、コンピュータの環境開発にはNTT情 報通信処理網研究所の安田、高木、島崎氏にお世話になりました。 これらの方々に深く感謝いたします。



Jin'ichi Murakami 平成13年10月5日