実験結果を表3に示す。この結果から以下のこ とがわかった。
学習方法 | 形態素解析 | openデータ | closedデータ |
直接算出 | Viterbi | 62.5% | 64.2% |
直接算出 | Forward | 70.2% | 70.2% |
Baum-Welch | Viterbi | 36.0% | 39.8% |
Baum-Welch | Forward | 44.8% | 43.6% |
表4に、品詞ラベルが付与されているテキスト データからパラメータを直接計算して形態素解析をForwardアルゴ リズムで計算したときのopenデータにおける形態素解析の誤出力の 種類を、誤りの多い方から示した。この表から普通名詞をサ変名詞 とする誤りが最も多いことがわかる。
正解 | 出力 | 誤出力に対する出現率 |
普通名詞 | サ変名詞 | 8.9% |
助動詞・終止 | 格助詞 | 3.8% |
助動詞・終止 | 助動詞・連用 | 3.0% |
普通名詞 | 接尾語 | 2.8% |
普通名詞 | 数詞 | 2.8% |