「香川」「徳島」「愛媛」「高知」

(正解例1)
四国地建は二十四日、瀬戸大橋中ほどの与島パーキングエリア(香川県坂出市)で、たそがれコンサートを開く。
(正解例2)
2005年に4町の合併で発足した徳島県阿波市では思わぬ事態に。
(正解例3)
伊方原発(愛媛県伊方町)の建設・稼働を推進した。
(正解例4)
13日まで4日連続40度以上だった高知県四万十市は38・6度だった。
(誤り例1)
鳥取の投票価値を1人1票とすると、高知(香川)は0・59票となる。
(誤り例2)
高知(徳島)県矢野では銅鐸を木の入れものに納めて埋めた穴の上に簡単な構造の小屋が建っていたことが分かりました。

(誤り例3)
徳島(愛媛)2区、当選3回、42歳。

(誤り例4)
研究グループはより多くのデータを集めるため香川(高知)県歯科医師会にも協力を打診し、今後、元船員らに歯の提供を呼びかける。

4.9に単語組「香川」「徳島」「愛媛」「高知」の機械学習の分類結果を示す. 表4.10に単語組「香川」「徳島」「愛媛」「高知」の正規化α値に基づいた機械学習が参考にした素性を示す.




Table 4.9: 機械学習の分類結果(「香川」「徳島」「愛媛」「高知」)
  データ数 再現率 適合率
香川 1000 0.63 0.63
徳島 1000 0.56 0.56
愛媛 1000 0.61 0.62
高知 1000 0.56 0.56
総数 4000 0.59 0.59


Table 4.10: 機械学習が参考にした素性(正規化 1#1値:「香川」「徳島」「愛媛」「高知」)


28#28


四国四県を全てにおいてその県の有名な市や町の名前が有用な素性として得ることができた.

しかしながら,「香川」だけはプロサッカー選手である「香川真司」選手をはじめとした「香川」という名字の人も多く見受けられた.また,香川選手関連の情報として「プレー」や「ドルトムント」,「本田」(圭佑選手)などサッカーやチーム,他の選手に関連する素性も頻出していた.

「徳島」は徳島県に関する地名が一番多く出現していたが,隣県である兵庫県の「神戸」や「淡路島」だけでなく「近畿」といった単語も見受けられ,四国と本州を「鳴門」海峡で結ぶ県として重要な役割を担っていることがわかった.

「愛媛」における有用な素性は「原発」である.「新居浜」や「伊方」といった地名が多く見受けられ,「四国電力」や「対策」,「稼働」のような素性も出現していた.

「高知」ではプロ野球のキャンプ地になることが多いことから「キャンプ」やそのキャンプ地の場所,選手名が多く挙げられていた.また,「地震」という単語も素性としてあり,調べると高知県は四国の南端にあることから,東日本大震災を受け,南海トラフ地震への対策が行われていることがわかった.