表4.5に単語組「春」「夏」「秋」「冬」の機械学習の分類結果を示す. 表4.6に単語組「春」「夏」「秋」「冬」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
春 | 1000 | 0.53 | 0.52 |
夏 | 1000 | 0.44 | 0.47 |
秋 | 1000 | 0.48 | 0.48 |
冬 | 1000 | 0.59 | 0.56 |
総数 | 4000 | 0.51 | 0.51 |
「春」からは想定されがちな「花」や「桜」のような植物に関する単語だけでなく,「開業」や「卒業」,「就職」のような「物事の区切り」や「心の入れ替わり」がなされるような単語も多く見受けられた.また,春は選抜高校野球選手権大会(センバツ)が行われることから,対比関係になりやすい「秋」とほぼ同頻度で「夏」や「センバツ」という単語も見受けられた.
「夏」からは甲子園や大会,参院のような夏にある「大きなイベント」が頻出した一方で,東日本大震災後の新聞からは「福島」や「電力」,「節電」という単語も多く見受けられた.また,「最高の夏」や「最後の夏」という言い回しもよくされることがわかった.
「秋」からは「紅葉」や「収穫」など実りに関することが多く出現したのに対し,「問題」や「疑惑」という単語が多く出現する季節でもあった.この「問題」や「疑惑」が出現した文章を見ると,
また「消費」という単語については,秋に食べ物や物の消費がよくされるという旨の文章も見受けられたが,一番多かったのは「消費税増税」関連の記事であった.
「冬」からは「雪」や「スキー」のような雪に関することや「ソ連」や「北海道」など多く雪が降る地域が頻出したほか,「家族」や「旅行」のような「身内とだんらんを楽しむ」季節でもあることもわかった.