実験結果

まず、学習データ内に10回以上出現した名詞は7307単語存在し、その中でお互いに最も高い類似度を示した組み合わせは1008組存在した(表4.2)。


Table: 抽出結果
  名詞 組み合わせ総数 
7307 1008

そのうち、対義関係にあったペアは60組(成功例)、別の対義語とのペアが28組(失敗例1)、対義語を持たない単語とのペアが211組(失敗例2)、対義語を持たない名詞どうしのペアが709組存在した(その他)。 以下にそれぞれのグループとそのペアの例を示す。

学習データから抽出した名詞について、対義関係を持つ単語が存在するものは299組(成功例+失敗例1,2)であり、全体の29%ほどであった。そのうち、対義語をもつ名詞を含むペアはおよそ20%であった(成功例/(成功例+失敗例1,2))。そのうち、うまく対義関係を抽出できたものは60組であり、対義語をもつ単語のみの組み合わせにおいて、およそ68%の精度で抽出することが出来た(成功例/(成功例+失敗例1))。
しかし、全体の91%は対義語を持たない単語を含んだ組み合わせであり(失敗例2+その他)、対義語抽出におけるノイズとなり、全体の精度としては、約5.9%ほどという結果になった。