next up previous contents
次へ: 謝辞 上へ: thesis 戻る: 場所から存在物を検出   目次

おわりに

本研究では,観光支援として存在性情報の抽出を行った. 抽出方法はSVMを用いて文章から存在物と場所の抽出, および,それらの対応を検出を行った.

存在物の抽出では,固有表現タグが付与されていない一般名詞の抽出を行った. 実験を行った結果,固有表現タグより多く場所と存在物が抽出できた.

存在物と場所の検出では, 存在物と記事内にある場所をそれぞれペアにし, 各ペアに対して存在物と場所が対応しているかをSVMで識別した.

ドクターイエローコーパスを用いてクロスバリテーション, お土産コーパスを用いてクロスバリテーション, および,学習データにドクターイエローコーパスを, テストデータにお土産コーパスを用いる3種類の実験条件で行った. リンク単位での検出結果はベースラインのF値が0.59で一番高くなった. しかし,表現単位での検出結果は提案手法($M_3$)のF値が0.66となった.

Google検索の結果と提案手法の比較を行った. ドクターイエローコーパスの場合, Google検索で得ることができた存在する場所は駅名がほとんどであった. しかし,提案手法では駅名の他にも,富士川や中里などの存在する場所も得ることができた.

お土産コーパスの実験でF値の向上を確認できたこと, Google検索との比較でGoogle検索で得られない場所を得られたことから, 提案手法に対する一定の評価を得ることができたと考える. 今後の課題は,場所から存在物の対応検出を行うこと,および, 時間の存在する時間(いつ見ることができるか)の情報抽出を行うことである.



平成26年3月5日