next up previous contents
次へ: アクセント情報の情報量の値の信頼性 上へ: 実験結果 戻る: 実験条件   目次

実験結果

  1. アクセント情報が一致する漢字仮名交じり文の数

    各文節に対する実験結果を図7.3に示した。 この図では横軸は文節番号 で、縦軸は各情報で一致した漢字仮名交じり文の数を $\log$スケー ルで書いた。×は音素ー漢字変換によって生成された漢字仮名交じり 文の数、○は音素情報が一致した漢字仮名交じり文の数、△は音素 情報とアクセント句境界が一致した漢字仮名交じり文の数、□は音 節情報とアクセント句境界およびアクセント核が一致した漢字仮名 交じり文の数を示している。

    この結果から、文節番号によって、各情報で一致した漢字仮名まじ り文の数に大きな差があることがわかる。なおグラフ中空白になっ ている文節は、音素ー漢字変換の出力の漢字仮名交じり文の数が多 すぎるため、処理を中止したことを示している。

    図 7.3: 一致した漢字仮名交じり文の数
    \begin{figure}\begin{center}
\epsfile{file=PAUSE/result-of-experimence.ps,width=100mm}
\end{center}\end{figure}

  2. アクセント情報の持つ情報量 50文節を実験して得られた各情報量の平均値を、表7.2に示した。実 験の結果、アクセント句境界の位置が持つ情報量は 3.21bit、アク セント核の位置の持つ情報量は 1.97bit、アクセント情報が持つ情 報量は 5.16bitであることが示された。


    表 7.2: アクセント情報の持つ情報量 (bit)
    情報 情報量 分散
    アクセント句境界の位置 3.21 3.37
    アクセント核の位置 1.97 1.62
    アクセント情報 5.16 3.20
    (アクセント句境界+アクセント核)    

    なお文献[60]では、日本語における音節のエント ロピーは5.55bitであることが報告されている。今回、78日分の 日経新聞の記事を文節に区切って、音節のエントロピーを計算 したところ 5.67bitであった。これらの値と比較すると、アクセント情 報の持つ情報量は絶対量としては高い情報量を持っていると評 価できる。



Jin'ichi Murakami 平成13年1月5日