表4.29に単語組「赤」「青」「黄」の機械学習の分類結果を示す. 表4.30に単語組「赤」「青」「黄」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
赤 | 1000 | 0.73 | 0.71 |
青 | 1000 | 0.67 | 0.66 |
黄 | 1000 | 0.77 | 0.81 |
総数 | 3000 | 0.72 | 0.72 |
「赤」「青」「黄」すべての色において,国旗や信号,物のカラーバリエーションを表す文章に多く出現していたため,「赤と青」,「青と黄」,「赤と黄」,もしくは「赤,青,黄」すべてが文中に含まれている記事が多くあった.
各々の素性を見ていくと,「赤」の素性として色の要素では「青」や「黒」が多く見受けられ,赤色のものとして「ペン」や「バラ」,「富士」などの素性があった.
また,素性の一つに「新月」があったため詳しく記事を調べると,
という文を確認し,私は赤十字社がイスラム教圏に対する配慮を行っているということを初めて知ることができたため,いい知見が獲得できたのではないかと考える.
「青」の素性として,色の要素では「赤」や「黄色」が多く見受けられ,青色のものとして「青ジソ(シソ)」や「青切符」,「青イソメ」などの素性があった.
記事を調べると「青切符」とはさほど重大でない交通反則切符のことを指し,「青イソメ(アオイソメ)」は釣りでよく使われる餌のことであることがわかり,こちらも初耳であったため,いい知見が獲得できたのではないかと考える.
「黄」の素性として,色の要素では「褐色」や「水色」が多く見受けられた.黄色のものは「黄斑」,「ユズ」,「黄色ブドウ球菌」などの素性があった.また「黄」において出現率が高かった「韓国」や「中国」では「黄」という名字が多く存在することがわかった.