素性分析

本研究では素性分析を用いて賛成を得やすい文章の重要素性の獲得をする.4.2節と4.3節の表4.2から表4.7にME,SVMの機械学習で獲得できた単語の上位30素性と文字数の素性の上位10素性を掲載している.素性分析の結果,良いとされた素性は「うーん」,「予防」,「現場」などがME,SVMの上位30素性に共通して現れている.しかし,これらの単語が文章中に入っていることが要因で賛成を得やすい文章になっているとは考えにくい.逆にME,SVMの悪い素性に共通して現れている「バカ」,「幼稚」などはマイナスな意味を持つ単語なので,これらの単語が含まれている文章は誰かを批判している文章の可能性が高く,賛成を得にくいのではないかと考えることができる.

また,MEでは100文字より大きい文字数の文章が賛成を得やすいとされており,SVMでは200文字より大きい文字数の文章が一番賛成を得やすいとされている.このことから,賛成を得やすい文章にはある程度の文章量が必要となっていることがわかる.これは自分の意見の根拠を書くのにある程度の文字数が必要になってくるからではないかと考えることができる.