next up previous contents
Next: 再現率高の例「易しい」と「手軽い」 Up: 類義語対ごとの考察 Previous: 再現率低の例「見限る」と「見捨てる」   目次

再現率低の例「はみ出す」と「はみ出る」

(正解例1)
ヘルメットからはみ出したパーマネントの髪が印象的。
(正解例2)
首都のそばに住む「枠からはみ出た難民」は、伝染病流行の恐れなどから政府にとって、苦々しい存在だ。
(誤り例1)
少ないスポーツ施設の争奪戦で、三ツ沢球技場ではこの冬さっそくラグビーがはみ出した。
(誤り例2)
違反はサークルの線を踏んだり、はみ出て投げること。




表 6.11: 機械学習の結果(再現率低の例:「はみ出す」と「はみ出る」)
  再現率 適合率 総数
はみ出す 0.94 0.87 341
はみ出る 0.24 0.45 62




表 6.12: 機械学習が参考にした素性(再現率低の例:「はみ出す」と「はみ出る」)
はみ出す はみ出る
素性 正規化 22#22 素性 正規化 22#22
素性1:UNIGRAM 0.78 素性1:米 0.62
素性1:上 0.60 素性1:手 0.60
素性1:社会 0.58 素性1: 自分 0.59

再現率低の例として,「はみ出す」と「はみ出る」という対がある. これらの語は両方,EDR日本語単語辞書で概念識別子に1042abが与えられており, EDR概念辞書によるとこの識別子は「ある制限や範囲から食み出す」を意味する.

6.12より「はみ出す」の方が「はみ出る」に比べて一般的であることがわかった.しかし使い分けに役立つ情報は得られなく,例文を見ても「はみ出す」と「はみ出る」は互いに置き換えられ,人間が見ても判断することが難しい. これより,この類義語対は特別使い分けが必要でないといえる.



2018-03-09