次へ: 考察
上へ: trigramの有効性について
戻る: 実験条件
  目次
直接選出型文節処理方式において失敗した文節例と成功した文節例をそれぞ
れ図4.7、図4.8に示す。実験の
結果得られた音節、漢字かな、および品詞の文節候補の右端に示した数値はtrigram
の総積値の自然対数の逆数を文字数で割った値である。した
がって値が小さいほど尤度が高いことを示している。
図 4.7:
直接選出型文節処理方式における誤りの例
|
図 4.8:
直接選出型文節処理方式における正解例
|
このような出力結果を入力文節100件について集計した結果を
図4.9と図4.10に示す。
図 4.9:
音節選出型文節処理方式の実験結果
|
図 4.10:
直接選出型文節処理方式の実験結果
|
これらの図から以下のことがわかる。
- 文節候補の音節1位正解率
は最大値が直接選出型のtext-closed dataで79%、最小値がtext-open data
で56%であった。また、8位までの累積正解率は音節選出型と直接選出型で
の差はなく、text-closed dataで94%、text-open dataで93%であった。
- 漢字かなの文節候補の1位正解率は音節選出型でtext-closed dataでは
83%、直接選出型では84%であった。特に直接選出型では4位までの累積正
解率は99%を示した。また、text-open dataでは1位正解率が音節選出型は
70%、直接選出型では65%であるが、8位までの正解率は共に90%を越えた。
この値は、音節のtrigramを用いた文節候補で得られた正解率と
同等以上である。
- 品詞の文節候補の場合は音節や漢字かなの文節候補の場合より正解率
が遥かに低く、両方式で見て、1位正解率は27 42%、8位までの累積正
解率は 72 77%にしか過ぎない。しかし、text-open dataとtext-closed dataの正解率の差は殆どない。
Jin'ichi Murakami
平成13年1月5日