日本文校正支援システム(REVISE)は、人間が書いた単語接続規則な どの文法規則から、日本語の誤字脱字などの誤りを検出する機能を 持っている。そして人間が侵す誤りの中の90%を検出する性能を持っ ている[21]。このプログラムを用いて、 図7.2の漢字仮名交じり文の候補から誤りが検出さ れた数を研究した。結果を以下に示す。
大蔵省は | 大蔵商は | 大蔵将は | 大蔵小は |
大蔵称は | 大蔵抄は | 大蔵賞は | 大蔵衝は |
大蔵賞は | 大倉商は | 大倉賞は | 大倉小は |
大倉抄は | 大倉省は | 大倉ショウは |
この結果から単語接続規則などの文法規則の持つ情報量は となり、かなり小さいことがわかる。 これは同音異義語の曖昧さは単語接続規則などの文法規則では絞れ ないことを示している。また、この実験から音声認識においては文 法情報よりアクセント情報の方が情報量が大きく、その扱いが重要 であることが分かる。