貯金 | 貯蓄 | ||
素性 | 正規化α値 | 素性 | 正規化α値 |
素性1:定額 | 0.74 | 素性1:的 | 0.75 |
素性1:郵便 | 0.73 | 素性1:投資 | 0.70 |
素性1:郵政省 | 0.73 | 素性1:米国 | 0.64 |
再現率高の例として,「貯金」と「貯蓄」という対がある. これらの語は,EDR日本語単語辞書で概念識別子に0fbec6のみが与えられており, EDR概念辞書によるとこの識別子は「貯金」を意味する.
表6.4の「素性1:郵便」や「素性1:郵政省」からもわかるように,郵便貯金に関する文章では「貯金」が使用されている.また,正解例1でも「郵便局」という語が使用されており,この傾向が現れている.「貯蓄」を含む文章では,正解例2や表6.2の「素性1:米国」などから,国の財政状況などを述べた文章の場合は「貯蓄」を使用する傾向にあると推測できる. また,今回機械学習では正しく識別できなかった誤り例として記載しているが,誤り例1のように,話し言葉の中では「貯金」が使用される傾向にあった. これらより,この同義語対は使い分けを必要とする傾向にあると考えられる.