Next: 存在物と場所の対応検出
Up: 場所と存在物の情報抽出
Previous: パターン辞書の作成と拡張
目次
実験用の文対を,ブログサイトから47件抽出した.
そのうち,理論上,場所と存在物のペアが得られる文対は26件であり,そのペア数は35組であった.
逆に,場所と存在物が得られない文対は21 件であり,便宜上のペアを21組作った.
これより,正解の集合Aの大きさは56組となった.
次の3つの手法について性能を比較する.
- 手法1
- パターン辞書におけるパターン対が同時に2文対に適合する際に場所と存在物のペアを抽出
- 手法2
- パターン対を分解し,FP とSP の全ての組み合わせで再構成したパターン辞書を用いて,場所と存在物のペアを抽出
- 手法3
- パターン辞書を用いずに,3.1 節・手順2 で用いた場所と存在物の判定条件で,場所と存在物のペアを抽出
各手法の出力は場所と存在物のペアであり,同様に場所と存在物の得られない場合の出力はペアである.
ここで,出力の集合を1#1とし,手法の性能を一致率
2#2
結果を表2.1に示す.一致率が手法2で最大となった.
わずかではあるが,手法2の一致率が手法3のものより高い値を示している.
表 2.1:
場所と存在物の抽出結果
手法 |
出力数 |
一致数 |
一致数 |
1 |
48 |
28 |
0.27 |
2 |
57 |
37 |
0.36 |
3 |
65 |
35 |
0.34 |
root
2015-03-17