機械学習を用いた対義語の置き換え可否判定

佐々本ら[3]は機械学習の性能や素性が対義語対の使い分けに役立つと考え, 機械学習を用いて対義語対の使い分けを行い, その結果を用いて対義語対の置き換え可否を判定する研究を行った.

佐々本らは対義語の使い分けのために機械学習の最大エントロピー法を使用し,対義語の使い分けを行う. そして,結果を分類することにより,対義語の置き換えの可否を判定する.

対義語は, 荻原らの研究[1]で,20人の被験者の内置き換え17人以上が対義語であると判断したものを利用する.

対義語対ごとに対義語の使い分けの実験を行った.入力文は,1991年~1995 年,2011 年~2015 年の毎日新聞から獲得した,対義語対のいずれかの語を含む文である. 評価は10分割のクロスバリデーションで行った. 機械学習の再現率の高さごとに名詞の類義語対を,高・中・低に分類し, 機械学習における素性(学習に用いる情報のこと) を分析することで類義語の使い分けに重要な情報を把握した.

佐々本らの研究の成果として,機械学習の性能が高ければ置き換え可能であり, 機械学習の性能が低ければ置き換え不可能であるという, 機械学習の性能と対義語対の置き換え可否に逆の相関があることが確認できた. 更に,それぞれの対義語における有用な知見や対義語対の置き換え可否に関する知見などを獲得した.