表4.19に単語組「大雨」「洪水」「大雪」の機械学習の分類結果を示す. 表4.20に単語組「大雨」「洪水」「大雪」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
大雨 | 1000 | 0.79 | 0.80 |
洪水 | 1000 | 0.83 | 0.83 |
大雪 | 1000 | 0.82 | 0.80 |
総数 | 3000 | 0.81 | 0.81 |
「大雨」,「洪水」,「大雪」全てにおいて正解率が約8割となり,かなり使い分けが必要な単語であることがわかった.
「大雨」の素性として「雨」や「梅雨」,「台風」など雨を伴う気象のほか,「土砂」,「浸水」,「避難」など大雨による災害に関する単語も頻出していた. また,大雨が多く降った地方も素性に出ていたが,一番正規化 1#1値が高かったのは「九州」であった.
「洪水」の素性として,「タイ」や「バンコク」が挙げられる.タイでは2011年に起きた大洪水によって多くの死者が多く出たことが素性を読み取ることで得ることができた.また,洪水による被害は企業や自然にも及び,素性として「工場」,「汚染」,「森林」,「米」などの単語も多く出現していることがわかった.
「大雪」の素性として,やはり「日本海」,「甲信」,「北海道」など,雪が降る地域が多く出現していた.また,「大雨」と同様,「停電」,「事故」,「孤立」など大雪時に起こりうる災害も多数出現していた.