沢はYahoo!知恵袋データから就職活動情報を抽出し,分析した. Yahoo!知恵袋の記事のうち,「就活」「就職活動」を含む記事と,カテゴリが「就職活動」である記事を得た.得られた記事を分析し,就職関連情報の抽出に役立てた. 記事分類に基づく分析では機械学習を利用し,元々カテゴリのない文書データにカテゴリを付与し,不要なカテゴリを除外することで就職関連情報を抽出した. 実験の結果,恋愛のカテゴリは高精度で分類可能で,不要な記事の除外に役立った. 特徴単語抽出に基づく分析では,上位5カテゴリごとに特徴単語を分析し,各カテゴリの内容を把握するのに役立てる. 実験の結果上位5カテゴリの特徴的な名詞を多く抽出し,各カテゴリの内容の把握に役立った.
前山らはキーワード抽出を用いた就職活動支援システムを開発した. ユーザは指定ブラウザの拡張機能を設定することで,特定の就職支援サイトにアクセスした際,自動で対象の企業の情報(企業名,企業のURL,就職支援サイトのURL)を取得できる. 収集した企業のURLを基に就職支援サイトから企業情報を収集し,同業他社比較ページを作成する. また,収集した企業のURLを基に企業ホームページから,志望動機に適したキーワード抽出を行う. このキーワードに基づきツリー構造のキーワードグラフ(キーワードノード)を作成する. ユーザはキーワードグラフから,関連企業を参照することができる. このシステムにより,同業他社の比較と関連企業の発見が容易になり,志望企業決定までの作業の効率化が期待できる.