next up previous contents
Next: 実験 Up: 提案手法 Previous: 就職関連情報の抽出   目次

就職関連情報の分類

就職関連情報の抽出で最も性能が高かった手法で文を取り出し,分類する. 分類は学習データを使用し,類似した文集合を人手でまとめることで,以下の7つに決定した.
資格情報

資格に関する情報を含む文

例:``小型船舶操縦士の資格取得には、二通りの方法があります。''

職業情報

特定の職業に関する情報が含まれるとされる文

例:``医療事務の就職で大切なのは、年齢だけではなく、レセプト作成などの専門知識と、病院の顔としての人柄や心配りです。''

求職者ごとの情報

誰に向けられた就職関連情報なのかが明確な文(学生,主婦,障害者など)

例:``本書は、視覚障害者の大学進学から就職までの円滑な学生生活の実践的ノウハウを、視覚障害学生のニーズに沿って詳細に解説した、視覚障害学生との相互理解が深まるガイドブックです。''

求人情報

求人に関する情報が含まれる文

例:``地元の情報誌などを購入し、求人情報を調べる。''

関係無

就職関連情報でないと判定される文

例:``僕ら二人は大学で所属していたゼミから就職先まで同じ。''

就活支援情報

就職活動に必要な知識や技術に関する情報が含まれる文

例:``履歴書類の書き方、就職のための法律知識、ビジネスマナー、面接の受け方など。''

転職・再就職情報

転職や再就職に関する情報が含まれる文

例:``女性転職に有利な資格として考えられるのは、ホームヘルパーや医療事務、調剤報酬請求事務、介護事務等の福祉系のもの、又はパソコン関係の資格や経理関係の資格等も女性転職に有利な資格だと言え ...''

各文が上記分類先に分類されるか否かを,教師あり機械学習やルールベース手法より判定し,性能を比較する. ひとつの文に複数の分類先を付与する場合がある.

機械学習で用いる素性文をChaSenを用い単語に分割し,その単語を利用する. 機械学習にはSVMを用いる. 本研究では,「各分類先」と「その他の分類先」で7回に分け2値分類を行う. このような2値分類の例を図3.8に示す.

図 3.8: 2値分類
42#42

ルールベース手法では,各分類先ごとに単語辞書を作成し,ルールベース指定単語が含まれる文をその分類先とする.ルールベース指定単語の一覧を表3.1に示す. ルールベース指定単語は学習データを人手で分析し作成する.




表 3.1: ルールベース指定単語一覧
分類先 ルールベース指定単語
資格情報 技術士資格,日商簿記,建築士,建設業経理事務士,カラーコーディネーター,販売士 他676件
職業情報 ネットワーク設計,作業療法士,生産管理,フラワーデザイン,IT観光コーディネータ,マーケティング,証券,営業アシスタント 他1,253件
求職者ごとの情報 学生,大学生,新卒,既卒,中途,高校生,生徒,在学,進路,進学,留学,主婦,外国人,障害者,保護者,成績,院生,留学生,大学院生,大卒,大学新卒,中途採用,第二新卒,大学卒,既卒者,院卒,大学院卒,短大卒,新規学卒,修士卒,新卒大学生,高校卒,第二新卒者,高校新卒者,第2新卒,卒業予定者,高卒者,新規学卒者,新卒学生,専門学校卒,大学新卒者,新規卒業者,専門卒,高卒予定者,大卒者,新規高卒者,学卒者,新卒予定者,高校卒業予定者,新規高等学校卒業者,卒業見込,卒業見込み,修了見込み,退職予定,修了予定,高校三年,大学院,短大,子育てママ,子育て主婦,障がい者,父兄,内申点,新卒者,高卒,大学卒業者,高校卒業生,高校卒業者,新規学校卒業者,卒業予定,高等学校卒業者,大学卒業生,大学卒業予定者,高等学校卒業予定者,就職希望者,外国人留学生,短大生,高専卒,中卒,女子学生
求人情報 求人,求職,応募資格,活かし,活かす,仕事探し
就活支援情報 自己表現,志望動機,職業訓練,マナー,セミナー,インターンシップ,ワープロ,面接,スキルアップ
転職・再就職情報 転職,再就職

ベースライン手法は,全てを各分類先と判定する手法である.ベースライン手法で各分類先に分類された文章の個数から再現率の分母を推定する.


next up previous contents
Next: 実験 Up: 提案手法 Previous: 就職関連情報の抽出   目次
Ryohei Abe 2015-03-10