表4.9に単語組「香川」「徳島」「愛媛」「高知」の機械学習の分類結果を示す. 表4.10に単語組「香川」「徳島」「愛媛」「高知」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
香川 | 1000 | 0.63 | 0.63 |
徳島 | 1000 | 0.56 | 0.56 |
愛媛 | 1000 | 0.61 | 0.62 |
高知 | 1000 | 0.56 | 0.56 |
総数 | 4000 | 0.59 | 0.59 |
四国四県を全てにおいてその県の有名な市や町の名前が有用な素性として得ることができた.
しかしながら,「香川」だけはプロサッカー選手である「香川真司」選手をはじめとした「香川」という名字の人も多く見受けられた.また,香川選手関連の情報として「プレー」や「ドルトムント」,「本田」(圭佑選手)などサッカーやチーム,他の選手に関連する素性も頻出していた.
「徳島」は徳島県に関する地名が一番多く出現していたが,隣県である兵庫県の「神戸」や「淡路島」だけでなく「近畿」といった単語も見受けられ,四国と本州を「鳴門」海峡で結ぶ県として重要な役割を担っていることがわかった.
「愛媛」における有用な素性は「原発」である.「新居浜」や「伊方」といった地名が多く見受けられ,「四国電力」や「対策」,「稼働」のような素性も出現していた.
「高知」ではプロ野球のキャンプ地になることが多いことから「キャンプ」やそのキャンプ地の場所,選手名が多く挙げられていた.また,「地震」という単語も素性としてあり,調べると高知県は四国の南端にあることから,東日本大震災を受け,南海トラフ地震への対策が行われていることがわかった.