next up previous
次へ: 韻律の情報と文法 上へ: 考察 戻る: 実験で求めた情報量の値の信頼性

漢字の読みの知識の情報量

日本語の漢字には複数の読みかたが存在する。そして前後の漢字や 意味によって、この読みかたが変化する。したがって音韻情報を漢 字かなまじり文に変換し、これを再び音韻情報に変換したとき、元 の音韻情報には戻らない漢字かなまじり文が存在する。図2におい て``私は牡蛎を和げた。''が良い例文である。 ここに漢字の読み の知識がはいると考えられる。この情報量も、今回の実験から簡単 に測定できる。計算式は$P$を(音韻情報の一致する漢字かなまじ り文の数/音韻漢字変換が出力する漢字かなまじり文の数)として、 漢字の読みの知識の情報量$E$$-\log_2(P)$となる。これを計 算すると2.26bit、分散は0.88となった。この値は音韻換算で0.41 となる。つまり漢字の読みの知識は、日本語の音韻のもつ平均情報 量より小さいと言える。



Jin'ichi Murakami 平成13年10月5日