next up previous contents
次へ: 基本的な測定方法のフローチャート 上へ: アクセント情報の持つ情報量の基本的な測定方法 戻る: 情報量の定義   目次


アクセント情報の持つ情報量の基本的な測定方法の考え方

本章では、仮名漢字変換において出力される漢字仮名交じり文の候 補の数の減少度という点に着目した。つまり、アクセント情報(ア クセント句とアクセント核)の持つ情報量は、音素情報から生成さ れる漢字仮名交じり文の数と、音素情報およびアクセント情報から 生成される漢字仮名交じり文の数を比較することによって測定でき ると思われる。具体的なアルゴリズムを次に示す。

  1. 初めに、正しい音素情報およびアクセント情報が与えらた と仮定する。

  2. 音素情報から漢字仮名交じり文を生成する。この音素ー漢字 変換は一般的に使用されている仮名漢字変換とほぼ同一と考えられ、 複数の漢字仮名交じり文が生成される。この候補の数を$c1$とする。

  3. 音素情報およびアクセント情報から漢字仮名交じり文を生 成する。この場合音素情報の他にアクセント情報も加わるため、生 成される漢字仮名交じり文の数は$c1$と比較すると減少すると思わ れる。この候補の数を$c2$とする。

  4. アクセント情報の持つ情報量は、音素情報から生成される 漢字仮名交じり文の数と、音素情報およびアクセント情報から生成 される漢字仮名交じり文の数を比較することによって測定できる。 アクセント情報の持つ情報量$E$ の計算式は $ -\log_2(c2/c1) $と 計算できる。



Jin'ichi Murakami 平成13年1月5日