next up previous contents
Next: 目次 Up: honron Previous: honron   目次

概要

ウェブ上には数多くの様々な就職活動に関連する情報が存在する. これらの情報を自動で収集し有効活用することができれば便利である. そこで,本研究ではウェブ上の大量データから,就職活動に関連した情報を抽出し,分類する.

ウェブからの就職活動情報の自動抽出の関連研究に,沢の研究[5]がある. 沢の研究では,Yahoo!知恵袋のデータから就職関連記事を抽出し,分析している. 本研究ではYahoo!知恵袋を含むより大きいウェブの情報源を用いるため,より多くの有用な情報が抽出できることが期待できる. また,抽出した就職関連情報を分類し,ユーザが役立てやすい形に近づける.

就職関連情報の抽出では,教師あり機械学習(SVM),ルールベース手法,ベースライン手法の3つの手法で性能を比較したところ,ルールベース手法が最良でF値7割程度の性能を得た. 就職関連情報の分類では,分類先として,``資格情報'',``職業情報'',``求職者ごとの情報'',``求人情報'',``関係無'',``就活支援情報'',``転職・再就職情報''の7つを設定した. 教師あり機械学習(SVM),ルールベース手法,ベースライン手法の3つの手法で性能を比較したところ,ルールベース手法が最良で各分類先でF値平均6割程度の性能を得た.



Ryohei Abe 2015-03-10