Next:
固有表現に基づく手法
Up:
提案手法
Previous:
提案手法
目次
重要情報の抽出
Wikipediaの城に関するページ(対象データ)を抽出し,その中から城に関する重要情報をCaboCha[
8
](固有表現抽出ツール)を用いた固有表現抽出に基づく手法とALAGIN[
9
]の上位下位知識に基づく手法の2手法で抽出する.抽出は城のページ単位で行う.表
3.1
のように最初に出現した重要情報のみをまとめた表と,表
3.2
のように出現した全ての重要情報をまとめた表の2つを作成する.
表 3.1:
最初に出現した重要情報の表の例
城名
県
時代
地名
元号
川田城
岐阜県
室町時代
原
康正
宇和島城
江戸時代
石垣
慶長
表 3.2:
出現した全ての重要情報の表の例
城名
県
時代
地名
元号
川田城
岐阜県,愛知県
室町時代,戦国時代
原,田町,室町,愛知,一宮,加,一方,城内,関,松原,館
康正,長久
宇和島城
江戸時代,安土桃山時代,現代
石垣,四国,中,北,兵衛,東,海,名城,原,岸,海岸,小屋,藤原,早川,大洲,戸田,関,富田,台,宝,城山,平成,三浦,館,千鳥,楚,谷
慶長,寛文,天慶,明治,文化,太平,昭和,承平,嘉禎,天文,天正,文禄,元和,平成
Subsections
固有表現に基づく手法
上位下位知識に基づく手法
OkadaTakuma 2015-03-10