作成した16,342組の文章対のうち,8,172組を学習データ,8,170組をテストデータとする.BERTでは8,172組の学習データのうち,2,045組を検証データ,6,129組を訓練データとして実験を行っている.表4.1は機械学習により“L" or “R"のどちらの文章が賛成を得やすいかを推定したときの正解率を示している.
表4.1に示されているようにBERT,ME,SVMの順で正解率が高くなっていることがわかる.一番性能が高いBERTで0.7506という正解率を得た.また,今回の実験ではME,SVMともに文字数の素性の有無で性能が大きく変化することはなかったが文字数の素性を利用するほうが正解率がわずかに高くなった.