次へ: 目次
上へ: honron
戻る: honron
目次
本研究は同義語の使い分けを教師あり機械学習を使用して行う.同義語は使い分けの必要がないと思いがちだが,使い分けの必要な場合がある.例えば「衣類」と「衣料」という同義語対では,「衣料品」ということはあるが「衣類品」ということはない.
ある同義語対での機械学習の性能が高く,より正確に使い分けを行えていた場合は,その同義語対は特に使い分けの必要な同義語対とわかり,機械学習での性能が低かった同義語対は,それほど使い分けの必要がないと推定できる.また,機械学習が使用した素性を分析して,同義語の使い分けに役立つ情報の考察も行う.このような実験と調査を既存の辞書から獲得できた同義語対を対象に行う.
本研究の成果は2つある.1つ目は,今回行った機械学習の性能がよく,この手法自体が同義語の使い分けに対して有用であることが挙げられる.2つ目は,同義語対ごとの機械学習の性能に基づき,同義語対を使い分けが必要なものとそれほど必要でないものに分類したことである.今回の実験で,特に使い分けが必要であるとされた同義語対に「貯金」と「貯蓄」などがあった.また,いくつかの同義語対について実際に使い分けに役立ったと思われる情報を明らかにした.
平成25年2月19日