next up previous
次へ: 考察 上へ: 実験結果 戻る: アクセント情報が一致する漢字かなまじり文の数

アクセント情報の持つ情報量

50文節を実験して得られた各情報量の平均値を、表2に示した。実 験の結果、アクセント句境界の位置が持つ情報量は 3.21bit、アク セント核の位置の持つ情報量は 1.97bit、アクセント情報が持つ情 報量は 5.16bitであることが示された。

ところで文献10では、日本語における音韻のエントロピーは 5.55bitであることが報告されている。今回、日経新聞78日文を文 節単位にくぎって音韻のエントロピーを計算したところ 5.67bitで あった。したがって、音韻の情報量と比較すると、アクセント句境 界が持つ情報量は 0.58、アクセント核の持つ情報量は 0.36、アク セント情報が持つ情報量は 0.93になる。

これらの値から、アクセント情報の持つ情報量は日本語の1音韻の 平均の情報量と比較するとわずかに小さいが、かなりの情報量を持っ ていると評価できる。


表 2: アクセント情報の持つ情報量 (bit)
情報 情報量 分散
アクセント句境界の位置 3.21 3.37
アクセント核の位置 1.97 1.62
アクセント情報 5.16 3.20
(アクセント句境界+アクセント核)    



Jin'ichi Murakami 平成13年10月5日