実験結果

次へ: アクセント情報の情報量の値の信頼性 上へ: 実験結果 戻る: 実験条件目次

実験結果

アクセント情報が一致する漢字仮名交じり文の数
各文節に対する実験結果を図7.3に示した。この図では横軸は文節番号で、縦軸は各情報で一致した漢字仮名交じり文の数を $\log$ スケールで書いた。×は音素ー漢字変換によって生成された漢字仮名交じり文の数、○は音素情報が一致した漢字仮名交じり文の数、△は音素情報とアクセント句境界が一致した漢字仮名交じり文の数、□は音節情報とアクセント句境界およびアクセント核が一致した漢字仮名交じり文の数を示している。
この結果から、文節番号によって、各情報で一致した漢字仮名まじり文の数に大きな差があることがわかる。なおグラフ中空白になっている文節は、音素ー漢字変換の出力の漢字仮名交じり文の数が多すぎるため、処理を中止したことを示している。

図 7.3: 一致した漢字仮名交じり文の数
$\begin{figure}\begin{center} \epsfile{file=PAUSE/result-of-experimence.ps,width=100mm} \end{center}\end{figure}$

**図 7.3:** 一致した漢字仮名交じり文の数
$\begin{figure}\begin{center} \epsfile{file=PAUSE/result-of-experimence.ps,width=100mm} \end{center}\end{figure}$

アクセント情報の持つ情報量 50文節を実験して得られた各情報量の平均値を、表7.2に示した。実験の結果、アクセント句境界の位置が持つ情報量は 3.21bit、アクセント核の位置の持つ情報量は 1.97bit、アクセント情報が持つ情報量は 5.16bitであることが示された。

**表 7.2:** アクセント情報の持つ情報量 (bit)
情報	情報量	分散
アクセント句境界の位置	3.21	3.37
アクセント核の位置	1.97	1.62
アクセント情報	5.16	3.20
（アクセント句境界＋アクセント核）

なお文献[60]では、日本語における音節のエントロピーは5.55bitであることが報告されている。今回、78日分の日経新聞の記事を文節に区切って、音節のエントロピーを計算したところ 5.67bitであった。これらの値と比較すると、アクセント情報の持つ情報量は絶対量としては高い情報量を持っていると評価できる。

Jin'ichi Murakami 平成13年1月5日