next up previous contents
Next: 表の評価方法 Up: 実験 Previous: 実験   目次

実験条件

実験データには,Wikipediaの3,264,893ページ(2014年11月現在)を用いる.Wikipediaからのデータの抽出は,記事単位で行う.本研究では「城」というキーワードに基づき記事の抽出を行う.

実験1
固有表現抽出に基づく手法と上位下位知識に基づく手法を用いて,Wikipediaの城に関するページの情報抽出を行い,表にまとめる.さらに,固有表現抽出に基づく手法で抽出された重要情報の正解率を「地名」「人名」「組織名」でそれぞれ求め,上位下位知識に基づく手法で抽出された重要情報の正解率を「県」「時代」「地名」「元号」でそれぞれ求める.
実験2
重要情報抽出の実験において作成された表の空欄が,正しく抽出されているかどうかの性能評価を行う.その後,比較手法と提案手法の性能の比較を行う.



OkadaTakuma 2015-03-10