類似度

出現回数10回で抽出した結果(BL)に、全体の類似度の平均値、成功例の平均値でフィルタリングした。各平均値は表5.2に、結果は表5.3に示す。


Table: 類似度の平均値
全体 成功例
0.47 0.48


Table: 平均値の抽出結果
  成功例 失敗例1 失敗例2 その他 合計  
全体 26 9 79 352 466  
成功例 25 9 72 319 425  
BL 60 28 211 709 1008  

結果は、全体としては、どちらも5%ほどであまり差がなかった。対義語を含むペアの中では、22%,23%(成功例/(成功例+失敗例1,2))と上昇している。しかし、全体としての抽出制度が向上していないので、こちらもノイズとなる単語をうまく除去することが課題である。