表4.25に単語組「朝」「昼」「夕」「夜」の機械学習の分類結果を示す. 表4.26に単語組「朝」「昼」「夕」「夜」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
朝 | 1000 | 0.53 | 0.57 |
昼 | 1000 | 0.61 | 0.62 |
夕 | 1000 | 0.56 | 0.51 |
夜 | 1000 | 0.46 | 0.47 |
総数 | 4000 | 0.54 | 0.54 |
「朝」の素性として,「出勤」や「通学」,「学生」などの単語が多いほか,「朝早く」という表現や「捜索」,「見つかる」のような事件の捜索や発見に関する単語も多く見受けられた.
「昼」の素性として,「昼から夕方」や「昼から夜」にかけてという表現が多いほか,政党や議員,主席などが会談やどこかしらに「出発」する時間であることもわかった.
「夕」の素性として,著名人や自衛隊等が「帰国」したり,「会見」を行う時間であることがわかった.また記事を確認すると,夕方に行われる会見では「正式な発表」がなされることが多いということが知見として得られた.
「夜」の素性として,「昼」と同様に「夜から未明」,「夜から朝」にかけてという表現が多いほか,「朝」と同様に「夜遅く」という表現や「判明」という単語が頻出しているなど,朝と夜という相対的な単語と思われているものが実はよく似た素性を持っているという知見を得た.