next up previous contents
次へ: 文法規則の情報とアクセント情報の情報量の比較 上へ: 考察 戻る: 考察   目次

漢字の読みの知識の情報量とアクセント情報の情報 量の比較

日本語の漢字には複数の読みかたが存在する。そして前後の漢字や 意味によって、この読みかたが変化する。したがって音素情報を漢 字仮名交じり文に変換し、これを再び音素情報に変換したとき、元 の音素情報には戻らない漢字仮名交じり文が存在する。図 7.2において ``私は牡蛎を和げた。'' が良い例文である。 ここに漢字の読みの知識がはいると考えられ る。この情報量を今回の実験から計算した。計算式は$P$を(音素 情報の一致する漢字仮名まじり文の数/音素ー漢字変換が出力する 漢字仮名交じり文の数)として、漢字の読みの知識の情報量$E$$-\log_2(P)$となる。実験の結果、情報量は2.26bit、分散は0.88 となった。これはアクセント情報の持つ情報量より小さい。つまり アクセント情報の情報量は、漢字の読みの知識の情報量より大きい と言える。



Jin'ichi Murakami 平成13年1月5日