概要

本研究はYahoo!ニュースのコメント欄を利用して賛成を得やすい文章の特徴の発見を目的とする.賛成を得やすい文章とはYahoo!ニュースの同じ記事に対してコメントされた文章を比較し,賛成した人数がより多く,コメント時刻がより最近のコメントを賛成を得やすい文章だと定義している.比較した時の賛成を得やすい文章と賛成を得にくい文章を文章対として機械学習に入力し,どちらが賛成を得やすい文章かを推定させた.推定させた結果,BERT,最大エントロピー法,SVMの順で正解率が高くなり,一番正解率が高いBERTで0.7506となった.素性分析の結果,賛成を得やすい文章の素性だと納得できる素性の発見はできていないが,「バカ」や「幼稚」などの賛成を得にくい文章の素性だと納得できる素性はいくつか発見した.