next up previous
次へ: 2nd-order HMMを用いた形態素解析 上へ: Ergodic HMMを用いた形態素解析の実験 戻る: 形態素解析の実験条件

形態素解析の実験結果


実験結果を表3に示す。この結果から以下のこ とがわかった。


  1. 形態素解析の解析精度は、 品詞既知のテキストデータからパラメータを計算して形態素解析を Forwardアルゴリズムで計算した場合が最も高く、openデータにお いて70.2%を得た。
  2. Baum-Welch学習によってパラメータを計算したときの 形態素解析の解析精度は、品詞既知のテキ ストデータから計算した場合より低く44.8%であった。
  3. いずれの実験でもForwardアルゴリズムを用いて得られた解析精度は、 Viterbiアルゴリズムより高かった。



表 3: Ergodic HMMによる形態素解析の実験結果 解析精度(%)
学習方法 形態素解析 openデータ closedデータ
直接算出 Viterbi 62.5% 64.2%
直接算出 Forward 70.2% 70.2%
Baum-Welch Viterbi 36.0% 39.8%
Baum-Welch Forward 44.8% 43.6%

4に、品詞ラベルが付与されているテキスト データからパラメータを直接計算して形態素解析をForwardアルゴ リズムで計算したときのopenデータにおける形態素解析の誤出力の 種類を、誤りの多い方から示した。この表から普通名詞をサ変名詞 とする誤りが最も多いことがわかる。



(品詞既知,Forward,openデータ)
表 4: Ergodic HMMを用いた形態素解析の誤出力
正解 出力 誤出力に対する出現率
普通名詞 サ変名詞 8.9%
助動詞・終止 格助詞 3.8%
助動詞・終止 助動詞・連用 3.0%
普通名詞 接尾語 2.8%
普通名詞 数詞 2.8%





平成15年9月30日