漢字の読みの知識の情報量

次へ: 韻律の情報と文法 上へ: 考察 戻る: 実験で求めた情報量の値の信頼性

漢字の読みの知識の情報量

日本語の漢字には複数の読みかたが存在する。そして前後の漢字や意味によって、この読みかたが変化する。したがって音韻情報を漢字かなまじり文に変換し、これを再び音韻情報に変換したとき、元の音韻情報には戻らない漢字かなまじり文が存在する。図２において``私は牡蛎を和げた。''が良い例文である。ここに漢字の読みの知識がはいると考えられる。この情報量も、今回の実験から簡単に測定できる。計算式はを（音韻情報の一致する漢字かなまじり文の数／音韻漢字変換が出力する漢字かなまじり文の数）として、漢字の読みの知識の情報量は $-\log_2(P)$ となる。これを計算すると2.26bit、分散は0.88となった。この値は音韻換算で0.41 となる。つまり漢字の読みの知識は、日本語の音韻のもつ平均情報量より小さいと言える。

Jin'ichi Murakami 平成13年10月5日