おわりに

本研究では賛成を得やすい文章の特徴の発見を目的としている.Yahoo!ニュース内にある1,000コメント以上持つ300記事からコメント時刻と賛成した人数の情報を使用し,同じ記事に対する2つのコメントを比較する.その際にコメント時刻がより最近であるコメント,賛成した人数がより多いコメントの2点を満たすコメントを賛成を得やすい文章だと定義する.

この2点を満たすコメントで文章対を大量に作成し,どちらの文章が賛成を得やすいかを教師あり機械学習を利用し推定させた.推定させた結果,BERT,ME,SVMの順で正解率が高くなった.一番性能が高いBERTの正解率が0.7506となった.素性分析の結果では,賛成を得やすいと納得できる素性は得られなかった.逆に,賛成を得にくいとされた「バカ」,「幼稚」などの素性は皮肉や誰かを批判する文章になるため賛成を得にくい文章になっていると考えられる.また.文字数の素性分析の結果,賛成を得やすい文字数は100文字や200文字より大きい文字数が良いとされた.これは賛成を得やすい文章にはコメントの説明にある程度の文字数が必要だと考えられる.

今後は分野によって良い素性は変化するかなどの分野依存性や高評価だけでなく定義の部分で低評価数も考慮した賛成を得やすい文章の分析を行い,今回の研究と比較し,違いの発見などを目指す.