next up previous contents
Next: 固有表現に基づく手法 Up: 提案手法 Previous: 提案手法   目次

重要情報の抽出

Wikipediaの城に関するページ(対象データ)を抽出し,その中から城に関する重要情報をCaboCha[8](固有表現抽出ツール)を用いた固有表現抽出に基づく手法とALAGIN[9]の上位下位知識に基づく手法の2手法で抽出する.抽出は城のページ単位で行う.表3.1のように最初に出現した重要情報のみをまとめた表と,表3.2のように出現した全ての重要情報をまとめた表の2つを作成する.
表 3.1: 最初に出現した重要情報の表の例
城名 時代 地名 元号
川田城 岐阜県 室町時代 康正
宇和島城   江戸時代 石垣 慶長


表 3.2: 出現した全ての重要情報の表の例
城名 時代 地名 元号
川田城 岐阜県,愛知県 室町時代,戦国時代 原,田町,室町,愛知,一宮,加,一方,城内,関,松原,館 康正,長久
宇和島城   江戸時代,安土桃山時代,現代 石垣,四国,中,北,兵衛,東,海,名城,原,岸,海岸,小屋,藤原,早川,大洲,戸田,関,富田,台,宝,城山,平成,三浦,館,千鳥,楚,谷 慶長,寛文,天慶,明治,文化,太平,昭和,承平,嘉禎,天文,天正,文禄,元和,平成



Subsections

OkadaTakuma 2015-03-10