Next: 上位下位知識
Up: 実験環境
Previous: 実験データ
目次
本研究では文書から固有表現を抽出するためにCaboChaの固有表現抽出を用いる.
以下の図はWikipediaの根添城の記事から固有表現を抽出した例である.
活用型,活用形の後に固有表現タグが付与される.
LOCATIONは「地名」を,PERSONは「人名」を,ORGANIZATIONは「組織名」をそれぞれ表す.本研究ではこの3つのタグのどれかが付与された表現を抽出し表にまとめる.
図:
Wikipediaの記事にCaboChaを使用した結果の例
5#5 |
root
2017-03-04