おわりに

本研究では機械学習を用いて3,4組の単語の使い分けと知見獲得の研究を行った.本研究の成果は2つある.

第1の成果として,3,4組の単語組13組47単語について実験を行った結果,提案手法が0.68,ベースライン手法が0.28であったため,機械学習を用いる提案手法の正解率が無作為に単語を挿入した際に正解となるベースライン手法よりも高いことを確認した.これにより,今回提案した手法自体が3,4組の単語の使い分けに対して有用であると考えられる.

第2の成果として,3,4組の単語組について素性を分析し,使い分けに役立つ素性が多く得られた.例えば,「上」,「中」,「下」では「事実上」や「活動中」,「水面下」という使われ方をするの対し,「左」,「右」ではそのような使われ方がなされないということがわかった.また,「晴れ,雨,雪」では「晴れ」のみが「晴れ舞台」や「疑惑が晴れる」というような慣用句として有用な素性を多く得ることができた.

そのほか,該当単語を抜き出した新聞記事から当時の情勢や事件,言葉の使い方も知見として得られた.

今後の課題として,今回の実験では実験データを同数のみでしか研究を行っておらず,また各単語1000文または500文のみでしか行っていないため,データ数を同数ではなく単語の出現率に依存した場合での研究や1000文以上を対象にした研究も行う必要があると考えている.また,今回の研究では被験者実験も行っていない為,こちらも併せて今後の課題としたい.