実験結果

次へ: 考察 上へ: trigramの有効性について 戻る: 実験条件目次

直接選出型文節処理方式において失敗した文節例と成功した文節例をそれぞれ図4.7、図4.8に示す。実験の結果得られた音節、漢字かな、および品詞の文節候補の右端に示した数値はtrigram の総積値の自然対数の逆数を文字数で割った値である。したがって値が小さいほど尤度が高いことを示している。

**図 4.7:** 直接選出型文節処理方式における誤りの例
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure5.6.ps,width=90mm}}\end{center}\end{figure}$

**図 4.8:** 直接選出型文節処理方式における正解例
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure5.7.ps,width=90mm}}\end{center}\end{figure}$

このような出力結果を入力文節100件について集計した結果を図4.9と図4.10に示す。

**図 4.9:** 音節選出型文節処理方式の実験結果
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure5.9.ps,width=100mm}}\end{center}\end{figure}$

**図 4.10:** 直接選出型文節処理方式の実験結果
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure5.8.ps,width=100mm}}\end{center}\end{figure}$

これらの図から以下のことがわかる。

文節候補の音節１位正解率は最大値が直接選出型のtext-closed dataで79%、最小値がtext-open data で56%であった。また、8位までの累積正解率は音節選出型と直接選出型での差はなく、text-closed dataで94%、text-open dataで93%であった。
漢字かなの文節候補の1位正解率は音節選出型でtext-closed dataでは 83%、直接選出型では84%であった。特に直接選出型では４位までの累積正解率は99%を示した。また、text-open dataでは１位正解率が音節選出型は 70%、直接選出型では65%であるが、８位までの正解率は共に90%を越えた。この値は、音節のtrigramを用いた文節候補で得られた正解率と同等以上である。
品詞の文節候補の場合は音節や漢字かなの文節候補の場合より正解率が遥かに低く、両方式で見て、1位正解率は27 $\sim$ 42%、8位までの累積正解率は 72 $\sim$ 77%にしか過ぎない。しかし、text-open dataとtext-closed dataの正解率の差は殆どない。

Jin'ichi Murakami 平成13年1月5日