next up previous contents
次へ: 機械学習とチャンキング問題 上へ: 基本技術 戻る: 形態素・構文解析   目次

固有表現抽出

固有表現抽出とは,情報検索,情報抽出の基礎として, テキスト中から人名,地名,組織名などを自動的に抽出を行う処理である. SVM[3]やCRFを用いた機械学習に基づく手法で高い精度が報告されている. とくにSVMでは文頭または文末から決定的に固有表現タグを決定していく, 系列ラベリングを用いた方法で高い精度に達成している.

固有表現抽出の先行研究については2.5.2で述べる.



平成26年3月5日