漢字の読みの知識の情報量とアクセント情報の情報量の比較

次へ: 文法規則の情報とアクセント情報の情報量の比較 上へ: 考察 戻る: 考察目次

漢字の読みの知識の情報量とアクセント情報の情報量の比較

日本語の漢字には複数の読みかたが存在する。そして前後の漢字や意味によって、この読みかたが変化する。したがって音素情報を漢字仮名交じり文に変換し、これを再び音素情報に変換したとき、元の音素情報には戻らない漢字仮名交じり文が存在する。図 7.2において ``私は牡蛎を和げた。'' が良い例文である。ここに漢字の読みの知識がはいると考えられる。この情報量を今回の実験から計算した。計算式はを（音素情報の一致する漢字仮名まじり文の数／音素ー漢字変換が出力する漢字仮名交じり文の数）として、漢字の読みの知識の情報量は $-\log_2(P)$ となる。実験の結果、情報量は2.26bit、分散は0.88 となった。これはアクセント情報の持つ情報量より小さい。つまりアクセント情報の情報量は、漢字の読みの知識の情報量より大きいと言える。

Jin'ichi Murakami 平成13年1月5日

漢字の読みの知識の情報量とアクセント情報の情報 量の比較

漢字の読みの知識の情報量とアクセント情報の情報量の比較