データ作成

データの作成にはYahoo!ニュースのコメント欄にある,時刻と賛成した人数の情報を利用する.2021年9月〜12月の期間にYahoo!ニュースの1,000コメント以上投稿された記事を対象に,コメント,賛成数,時刻の情報を300記事分収集している.同じ記事に投稿された2つのコメントにおいて,賛成した人数がより多く,コメント時刻がより最近という2点を満たすコメントを賛成を得やすい文章,もう一方を賛成を得にくい文章だと定義する.そのような賛成を得やすい文章と賛成を得にくい文章を文章対として大量に作成する.ただし,一度でも文章対を作成する際に使用されたコメントは他の文章対では使用しないこととする.例を以下に掲載する.

コメントAを対の一方として文章対を作成する場合,定義に当てはめると文章対として使用できるもう一方はコメントDのみである.コメントBを対の一方として利用する場合も同様に文章対として使用できるもう一方はコメントDのみであり,コメントCは賛成した人数は一番多いがコメント時刻が一番古いためどのコメントとも文章対を作成することはできない.

よって,この4つのコメントで定義に当てはまり,文章対として使用できるコメント対はコメントAとコメントD,コメントBとコメントDのみである.この時,賛成を得やすい文章はコメントA,コメントBとなり,コメントDは賛成を得にくい文章となっている.しかし,本研究では文章対作成の際に一度使用したコメントは利用しないので,文章対として使用できるのはコメントAとコメントDの文章対かコメントBとコメントDの文章対のどちらか一つの文章対となっている.このように定義にあてはまる文章対をコメントデータから大量に作成する.