分類分けが中だが置き換え可の値が低かったもの

ここでは,分類分けが中だが置き換え可の値が高かったものとして,最も置き換え可の値が低かった,「閉める」「開ける」に関して考察する. 「閉める」「開ける」は置き換え可と判断された割合は0.27(8/30)である. 「閉める」「開ける」について考察する. 表5.21に機械学習の性能を示す.表5.22に機械学習が参考にした素性を示す.




Table 5.21: 機械学習の性能(「閉まる」「開ける」)
  データ数 再現率
閉まる 125 92.80%
開ける 125 88.80%




Table 5.22: 機械学習が参考にした性能(「閉める」「開ける」)
閉める 開ける
素性 数値 素性 数値
素性1:鍵 0.9645 素性1:道 0.9363
素性1:市場 0.9487 素性1:幕 0.8928
素性1:店 0.8230 素性1:ショー 0.7464

素性としては「閉める」は,「鍵」「店」「市場」「引き戸」など終了に関するものが見られた.以下に例を示す.

「開ける」は「幕を開ける」「道が開ける」といった慣用的な表現や, 「開催する」という意味になる「閉まる」の対義語ではない使われ方がされていた.以下に例を示す. などがあった.

中に分類されたにも関わらず置き換え可の値が低くなってしまった原因としては,両方ともある程度有用な素性が得られて機械学習の性能がある程度高くなった.だが,「開ける」は多義性があり,慣用的な表現が多くなったために, 置き換え可の値が低くなってしまったと考えられる.

分類分けが中だが置き換え可の値が低かったものとして,置き換え可の値が低かった,「閉まる」「閉じる」の考察を行った.置き換え可能が低くなった理由として, 佐々本ら[3]と同様に以下のようなものが見られた.

被験者実験と機械学習の性能の傾向が一致しなかった対義語対の考察をした結果,それぞれの対義語対で傾向が一致しなかった原因はわかったが,全体として傾向などはつかめなかった.高中低の分類ではなく機械学習の性能ごとに置き換え可否の値と比較する考察も重要であると考えられる.