next up previous contents
次へ: 本研究の位置づけ 上へ: 存在性情報の抽出タスク 戻る: パターン対を用いた存在物と場所の抽出   目次

日本語固有表現認識

笹野らはSVMを用いてIREX[8]で定義された固有表現の抽出を行った[2]. 抽出する表現のタイプとしては人名,地名,組織名などの固有名詞的表現のほかにも 時間表現や数値表現を対象とした.笹野らが抽出した固有表現を表2.1に示す.


表: 笹野らが抽出した固有表現の種類と例
  固有表現の種類
固有名詞的 組織名 ORGANIZATION NHK 交響楽団,ICAO
表現 人名 PERSON 福田康夫,川崎憲次郎
  地名 LOCATION アメリカ,新義州
  人口物名 ARTIFACT ノーベル賞,ひかり123号
時間表現 日付 DATE 6月17日,今年
  時刻 TIME 午後五時,正午
数値表現 金額 MONEY 500円,五・七新ペソ
  割合 PERCENT 90%,三分の一

笹野らの研究では一般名詞は抽出の対象としていない. また,抽出した物の存在性情報は解析していない.



平成26年3月5日