出現回数10回で抽出した結果(BL)に、全体の類似度の平均値、成功例の平均値でフィルタリングした。各平均値は表5.2に、結果は表5.3に示す。
Table:
類似度の平均値
全体 |
成功例 |
0.47 |
0.48 |
Table:
平均値の抽出結果
|
成功例 |
失敗例1 |
失敗例2 |
その他 |
合計 |
|
全体 |
26 |
9 |
79 |
352 |
466 |
|
成功例 |
25 |
9 |
72 |
319 |
425 |
|
BL |
60 |
28 |
211 |
709 |
1008 |
|
結果は、全体としては、どちらも5%ほどであまり差がなかった。対義語を含むペアの中では、22%,23%(成功例/(成功例+失敗例1,2))と上昇している。しかし、全体としての抽出制度が向上していないので、こちらもノイズとなる単語をうまく除去することが課題である。