対義語とは,意味が反対になっている語や意味が対称になっている語のことである.対義語には,文中のある単語を対義語に置き換える場合,対義語に沿うように文の内容を逆にしても対義語に置き換えができないものもある.例えば「引く」と「足す」で「AからBを引く」とはいうが,「AからBを足す」とはいわない.これは格が変化しているからである.本研究では置き換え可能の定義は,文中のある単語Xの対義語に沿うように文を知識的な内容だけ逆に変更した時(直前直後の付属語,係り受け関係にある文中の格助詞は変更しない),単語Xを対義語に置き換えれる場合,置き換え可能であると定義する.
また,対義語に関する研究では,荻原ら[1]が,分類語彙表に対義語情報を付与,その際,置き換え可否の情報を付与している.しかし,この作業は人手で行っており置き換え可否の情報付与に関しては例文を示していない.実際に置き換えてみないと判断がつかないものも多い.よって,例文を示さずに対義語対に置き換えの可否の情報を付与することは,正確性に欠ける.
また,佐々本ら[3]は機械学習の性能や素性が対義語対の使い分けに役立つと考え, 機械学習の最大エントロピー法を用いて対義語対の使い分けを行い, その結果を用いて対義語対の置き換え可否を判定する研究を行った. しかし佐々本らの研究では, 機械学習のに最大エントロピー法しか使用していなかった.
そこで本研究では,機械学習のBERT[4]用いて対義語対の使い分けを行い,その結果を用いて対義語対の置き換え可否を判定する. 機械学習を用いた対義語の使い分けの性能が悪い場合, 対義語の使い方の違いが不明瞭であると考えられる. よって, 対義語は置き換え可能であると考えられる. 一方で, 使い分けの結果が良い場合, 対義語対の使い分けの違いが明瞭であると考えられる. よって, 対義語は置き換え不可能であると考えられる. よって, 機械学習の使い分けの性能は置き換えの可否と逆の相関があると考えられる. よって, 機械学習の使い分けの性能は置き換えの可否と逆の相関があると考えられる. この考え方を用い, 機械学習のBERTを用いて対義語の使い分けを用い, 対義語対の置き換えの可否を判定した.
本研究の成果は,人手で行っていた作業を自動化し,また日本語学習者の対義語学習などに利用できると考える. 本研究では,荻原らの研究[1]で,20人の被験者の内置き換え17人以上が対義語であると判断したものを利用する.機械学習を行った対義語対の一部から例文を明示し被験者実験を行い,その結果を機械学習の性能と比較する.機械学習の性能と例文を提示し行った被験者実験の結果を比較し,機械学習の性能と被験者実験の結果に逆の相関があることを確認することを目的とする.
本研究の主な主張点を以下に整理する.
- 機械学習の性能と例文を明示した被験者実験の結果を比較し, 名詞や副詞では機械学習の性能と対義語対の置き換えの可否は逆の相関があることを, 佐々本ら[3]が行った最大エントロピー法と同様にBERTでも得られた.
- 対義語の機械学習の素性を分析することにより, それぞれの対義語における有用な知見や対義語対の置き換え可否に関する知見などを獲得した. 例えば,慣用的な表現が多く使われていたり, 対義語に多義性があると置き換え可の値が高くなることが, 佐々本ら[3]の研究と同様に確認できた.
本論文の構成は以下の通りである.
第2章では,本研究に関連する研究としてどのような研究が行われてきたかを記述し,その研究と本研究との関連を説明する.
第3章では,本研究が扱う問題の設定とそれを解決するために提案した手法について説明を行う.
第4章では,本研究が行った機械学習の実験についての説明と,被験者実験についての説明と,それら2つの結果を比較した結果について記述する.
第5章では,第4章の結果から素性分析による考察を行う.
第6章ではまとめを行う.