存在物の抽出では,固有表現タグが付与されていない一般名詞の抽出を行った. 実験を行った結果,固有表現タグより多く場所と存在物が抽出できた.
存在物と場所の検出では, 存在物と記事内にある場所をそれぞれペアにし, 各ペアに対して存在物と場所が対応しているかをSVMで識別した.
ドクターイエローコーパスを用いてクロスバリテーション, お土産コーパスを用いてクロスバリテーション, および,学習データにドクターイエローコーパスを, テストデータにお土産コーパスを用いる3種類の実験条件で行った. リンク単位での検出結果はベースラインのF値が0.59で一番高くなった. しかし,表現単位での検出結果は提案手法()のF値が0.66となった.
Google検索の結果と提案手法の比較を行った. ドクターイエローコーパスの場合, Google検索で得ることができた存在する場所は駅名がほとんどであった. しかし,提案手法では駅名の他にも,富士川や中里などの存在する場所も得ることができた.
お土産コーパスの実験でF値の向上を確認できたこと, Google検索との比較でGoogle検索で得られない場所を得られたことから, 提案手法に対する一定の評価を得ることができたと考える. 今後の課題は,場所から存在物の対応検出を行うこと,および, 時間の存在する時間(いつ見ることができるか)の情報抽出を行うことである.