文法規則の情報とアクセント情報の情報量の比較

次へ: アクセント情報と文法の関係 上へ: 考察 戻る: 漢字の読みの知識の情報量とアクセント情報の情報量の比較目次

文法規則の情報とアクセント情報の情報量の比較

日本文校正支援システム(REVISE)は、人間が書いた単語接続規則などの文法規則から、日本語の誤字脱字などの誤りを検出する機能を持っている。そして人間が侵す誤りの中の90%を検出する性能を持っている[21]。このプログラムを用いて、図7.2の漢字仮名交じり文の候補から誤りが検出された数を研究した。結果を以下に示す。

**表 7.3:** 音素情報およびアクセント情報の一致した漢字仮名交じり文入力「大蔵省は」
大蔵省は	大蔵商は	大蔵将は	大蔵小は
大蔵称は	大蔵抄は	大蔵賞は	大蔵衝は
大蔵賞は	大倉商は	大倉賞は	大倉小は
大倉抄は	大倉省は	大倉ショウは

この結果から単語接続規則などの文法規則の持つ情報量は $-\log_2(0.855)=0.23(bits)$ となり、かなり小さいことがわかる。これは同音異義語の曖昧さは単語接続規則などの文法規則では絞れないことを示している。また、この実験から音声認識においては文法情報よりアクセント情報の方が情報量が大きく、その扱いが重要であることが分かる。

Jin'ichi Murakami 平成13年1月5日