実験データ

本研究では,荻原らの研究[1]でまとめられた対義語データベースから被験者実験で20人中17人以上が対義語であると判断されたものを利用する.名詞,動詞,形容詞,副詞の対義語対の中から新聞記事の中に両方の対義語が50回以上出現したものからランダムに50対を抽出し,実験を行う.また副詞と形容詞に関しては条件を満たすものが副詞が8対,形容詞が46対であったので8対と46対で実験を行う.表4.1から表4.4に実験を行った対義語の組を示す.1991年から1995年,2011年から2015年の毎日新聞から対義語の組のいずれかの語を含む文を獲得した.データ数は学習に偏りを少なくするため対義語の組内で同数にして実験を行った.

被験者実験は,機械学習により求めた2つの対義語の正解率の低い方の性能をもとに対義語対を3種類(高90%以上,中80%以上90%未満,低80%未満)に分類し,その3種類から,4つの品詞(名詞,動詞,形容詞,副詞)ごとに3組ずつランダムに抽出し,合計36対(3×4×3)で実験を行う.副詞の中に分類されたものは2種類, 低に分類されたものは1種類しかなかったので,33対で実験を行った.表4.5に被験者実験を行った対義語の組を示す.


Table 4.1: 実験を行った名詞の対義語の組


4#4



Table 4.2: 実験を行った動詞の対義語の組


5#5



Table 4.3: 実験を行った形容詞の対義語の組


6#6



Table 4.4: 実験を行った副詞の対義語の組


7#7



Table 4.5: 被験者実験を行った対義語の組


8#8