next up previous contents
次へ: おわりに 上へ: 実験 戻る: 各評価基準における値   目次

評価のまとめ

5.3より,3#3 値で比較を行うと 58#58 もしくは 59#59 とした場合が最も性能がよく,かつ文の分析量が最も少なくなる組み合わせであることが分かる.比較手法1と比較すると同じ性能で分析量を30%削減しており,比較手法2で同じ量だけ分析を行った場合( 60#60 )と比較すると性能が3#3 値で0.08向上していることが分かる.

5.5より,カテゴリ再現率を考慮した場合においては,再学習による分析を行う場合は 61#61 のとき,すなわち全体の2割を再学習前に分析し,もう2割を再学習後に分析するという手法が最も効率が良く,比較手法2で同じ量だけ分析を行った場合( 62#62 )と比較すると性能はカテゴリ3#3 値で0.09上昇するということが分かる.

このことにより,再学習前に57#57 ,再学習後に57#57 分析を行うことで分析量を削減し,かつ様々なカテゴリを網羅できるということが分かった.

また,3#3 値およびカテゴリ3#3 値のどちらの場合の評価においても,能動学習も用いた場合は,21#21 の値に関わらず比較手法2において同じ量だけ分析した場合すなわち分析量を63#63 にした場合と比較して性能が上昇することが分かった.このことから,どのような場合においても能動学習を用いない場合よりも用いる場合がよいということが分かる.

しかし,今回の実験で求めた 61#61 という値の組み合わせは本実験コーパスに依存するものであり,別のコーパスにおいては最も性能が良くなる21#21 の値は変化すると考えられる.現在分析前にこの値を知ることはできないため,この値の組み合わせを分析前や途中に求めることができるような方法の考案が今後の課題として挙げられる.



syahana 平成24年3月14日