ウェブからの就職活動情報の自動抽出の関連研究に,沢の研究[5]がある. 沢の研究では,Yahoo!知恵袋のデータから就職関連記事を抽出し,分析している. 本研究ではYahoo!知恵袋を含むより大きいウェブの情報源を用いるため,より多くの有用な情報が抽出できることが期待できる. また,抽出した就職関連情報を分類し,ユーザが役立てやすい形に近づける.
就職関連情報の抽出では,教師あり機械学習(SVM),ルールベース手法,ベースライン手法の3つの手法で性能を比較したところ,ルールベース手法が最良でF値7割程度の性能を得た. 就職関連情報の分類では,分類先として,``資格情報'',``職業情報'',``求職者ごとの情報'',``求人情報'',``関係無'',``就活支援情報'',``転職・再就職情報''の7つを設定した. 教師あり機械学習(SVM),ルールベース手法,ベースライン手法の3つの手法で性能を比較したところ,ルールベース手法が最良で各分類先でF値平均6割程度の性能を得た.