next up previous contents
Next: 上位下位知識 Up: 実験環境 Previous: 実験データ   目次

固有表現抽出

本研究では文書から固有表現を抽出するためにCaboChaの固有表現抽出を用いる. 以下の図[*]はWikipediaの根添城の記事から固有表現を抽出した例である. 活用型,活用形の後に固有表現タグが付与される. LOCATIONは「地名」を,PERSONは「人名」を,ORGANIZATIONは「組織名」をそれぞれ表す.本研究ではこの3つのタグのどれかが付与された表現を抽出し表にまとめる.

図: Wikipediaの記事にCaboChaを使用した結果の例
5#5



root 2017-03-04