next up previous contents
Next: 就職関連情報の分類 Up: 実験 Previous: 実験   目次

就職関連情報の抽出

就職関連情報を抽出する際,``Bに役立つA''などの意味関係を含む文集合をALAGINの意味的関係抽出サービスで取得し,746,432文が得られた. 各手法の性能を調べるためにそのうちからランダムに抜き出した1,000文を評価に利用した. 就職関連情報の抽出の実験の流れを図4.1に示す.

図 4.1: 就職関連情報の抽出実験の流れ
43#43

教師あり機械学習の実験データはこの1,000文を用いて10分割クロスバリデーションで評価した. ルールベース手法では,「資格」「就職」「求人」を含むものを就職関連情報とした. 全ての文を就職活動関係と判別するベースライン手法も利用した.

各手法での結果を表4.1に示す.




表 4.1: 就職関連情報の抽出結果
手法 適合率 再現率 F値
教師あり機械学習 0.75 0.39 0.51
ルールベース手法 0.70 0.74 0.72
ベースライン手法 0.03 1.00 0.06

ルールベース手法が他手法よりも性能が良く,F値7割程度の性能を得た.



Ryohei Abe 2015-03-10