next up previous contents
Next: 提案手法との比較と考察 Up: 類義語対ごとの考察 Previous: 再現率中の例「だるい」と「けだるい」   目次

再現率低の例「見苦しい」と「みっともない」

(正解例1)
社会党がこの数カ月にみせた七転八倒は、見苦しいものではなかった。
(正解例2)
国際社会の結束が問われている時、元首相が行く行かないで日本が混乱したのはみっともない
(誤り例1)
なんと見苦しい姿をさらしてしまったことか。
(誤り例2)
米国と欧州が最後まで世界中に迷惑をかけた交渉の内容は、せんじ詰めれば現金の取り合いでコメよりずっとエゴの塊でみっともない




表 7.23: 機械学習の結果(再現率低の例:「見苦しい」と「みっともない」)
  再現率 適合率 総数
見苦しい 0.45 0.50 115
みっともない 0.71 0.66 176




表 7.24: 機械学習が参考にした素性(再現率低の例:「見苦しい」と「みっともない」)
見苦しい みっともない
素性 正規化 22#22 素性 正規化 22#22
素性1:あまりに 0.59 素性1:こと 0.61
素性1:言葉 0.59 素性1:交渉 0.56
素性1:姿 0.58 素性1:考え 0.55

再現率低の例として,「見苦しい」と「みっともない」という対がある.これらの語は両方,EDR日本語単語辞書で概念識別子に10a2c5が与えられており, EDR概念辞書によるとこの識別子は「見ていて不快な感じになるさま」を意味する.

7.18を見ると,α値に関わらず,どの素性も「見苦しい」,「みっともない」の両方で現れそうなことがわかる.また例文を見ても,「見苦しい」と「みっともない」は置き換えられ,人間が判断しても使い分けが難しいことがわかる.これより,この類義語対は特別使い分けの必要はないと言える.



2018-03-09