メダル | 賞牌 | ||
素性 | 正規化α値 | 素性 | 正規化α値 |
デフォルト素性 | 0.62 | 素性1:円 | 0.70 |
素性5:助詞 | 0.62 | 素性1:賞金 | 0.63 |
素性4:、 | 0.55 | 素性1:副賞 | 0.57 |
再現率高の例として,「メダル」と「賞牌」という対がある. これらの語は,EDR日本語単語辞書で概念識別子に103f04のみが与えられており, EDR概念辞書によるとこの識別子は「業績をほめたたえ記念として与えるメダル」を意味する.
表6.4を見てみると,機械学習が賞牌と推定するのに利用した素性には,「素性1:円」や「素性1:賞金」など賞金に関する素性が見られる.また正解例2や誤り例2からも確認できるように,何らかの大会などの結果,賞金などが授与されたことを示す文章では「賞牌」を使用するという使い分けがあることがわかる. また,機械学習がメダルと推定するのに参考にした素性に「デフォルト素性」が確認できる.これより,特徴のない文の場合は「賞牌」よりも「メダル」が使用される傾向にあるとわかる.