next up previous contents
次へ: 「メダル」と「賞牌」 上へ: 再現率高の例 戻る: 再現率高の例   目次

「貯金」と「貯蓄」

(正解例1)
また、大口定期預金の預け入れ最低限度引き下げとともに郵便局の貯金預け入れ上限額は現行の七百万円から一千万円に引き上げられる。
(正解例2)
これは投資が弱いためだが、この原因は家計部門の貯蓄が低く、投資資金を国内で調達するのに限界があるからだ。
(誤り例1)
今冬のボーナスの使い道はまだはっきりは決めていませんが、半分を貯金、残りの半分を旅行費用に充てようと考えています。
(誤り例2)
使い道のトップはやはり貯蓄で八二・七%。


表: 機械学習の結果(再現率高の例:「貯金」と「貯蓄」)
  再現率 適合率 総数
貯金 0.89 0.89 403
貯蓄 0.86 0.86 332


表: 機械学習が参考にした素性(再現率高の例:「貯金」と「貯蓄」)
貯金 貯蓄
素性 正規化α値 素性 正規化α値
素性1:定額 0.74 素性1:的 0.75
素性1:郵便 0.73 素性1:投資 0.70
素性1:郵政省 0.73 素性1:米国 0.64

再現率高の例として,「貯金」と「貯蓄」という対がある. これらの語は,EDR日本語単語辞書で概念識別子に0fbec6のみが与えられており, EDR概念辞書によるとこの識別子は「貯金」を意味する.

6.4の「素性1:郵便」や「素性1:郵政省」からもわかるように,郵便貯金に関する文章では「貯金」が使用されている.また,正解例1でも「郵便局」という語が使用されており,この傾向が現れている.「貯蓄」を含む文章では,正解例2や表6.2の「素性1:米国」などから,国の財政状況などを述べた文章の場合は「貯蓄」を使用する傾向にあると推測できる. また,今回機械学習では正しく識別できなかった誤り例として記載しているが,誤り例1のように,話し言葉の中では「貯金」が使用される傾向にあった. これらより,この同義語対は使い分けを必要とする傾向にあると考えられる.



平成25年2月19日