表4.23に単語組「晴れ」「雨」「雪」の機械学習の分類結果を示す. 表4.24に単語組「晴れ」「雨」「雪」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
晴れ | 1000 | 0.93 | 0.97 |
雨 | 1000 | 0.76 | 0.75 |
雪 | 1000 | 0.77 | 0.75 |
総数 | 3000 | 0.82 | 0.82 |
「晴れ」,「雨」,「雪」の組が全ての組の中で一番正規化 1#1値が高かった.
「晴れ」の素性として一番多かったのは「晴れ舞台」という表現であった.また,晴れ舞台のように天候の様子に限らず,「疑惑が晴れる」や「表情が晴れない」のような慣用句として有用な素性も得られた.
「雨」の素性として,「雪」や「台風」のように天候の様子についての単語の頻度が高く,また降水量の単位である「ミリ」や「傘」,「中止」や「避難」のような単語も得られていた.
「雪」の素性として,「氷」や「積雪」などはもちろんだが,「雨」はミリに対して「雪」は「センチ」で表される点に面白さを感じた.また雪の素性に「父」という単語があり,詳しく調べると