Next: 店名の抽出が完全である場合の追加実験
Up: 考察
Previous: 言語解析力の問題
目次
適合率,再現率が低い主な原因としては,場所名の抽出はMeCabの形態素解析に
よる地域名を利用しているため,人手の正解データで使用される「店名」や一部の「場所名」
が抽出できないことが挙げられる.
例として,図6.3のレス22では場所名として
「店名」である「阪神百貨店」が使用されている.こうした例は多数みられたため,
場所名の抽出を改善すれば適合率,再現率は向上すると考えられる.
図6.4に実際にMeCabによる出力を示す.
MeCabによる出力では「地域」とは出力されず,「組織」と出力される.
図 6.3:
店名
|
図 6.4:
MeCabによる出力
|
2013-02-23