next up previous contents
次へ: SVMによる分類の動作 上へ: 実装 戻る: ブログデータの収集   目次

素性の抽出

本研究では,ブログデータから素性を抽出し,ベクトル化することでSVMによる学習および分類を行う.以下に素性の抽出で使用したプログラムの一覧および各データの例を示す.また,プログラム名が括弧で囲まれているものは[1],[2]で既に用意済のプログラムである.


表: 素性抽出プログラム一覧
プログラム名 概要
(MorphAnalyzer.rb) ブログデータの形態素解析を行うプログラム
(ExtractFeatures.rb) 形態素データから各種品詞を抽出するプログラム
op1.sh,op2.sh [1]のプログラムを使用し,特徴度の算出を行うプログラム
op3.sh [1]のプログラムを使用し,情緒推定を行うプログラム
addfeature.rb 素性に特徴度を追加するプログラム
addemotion.rb 素性に情緒を追加するプログラム
tool.sh 上記のプログラムを用いてブログ収集および素性の抽出を行うプログラム


17#17

図: 抽出した素性の例
9#9



syahana 平成24年3月14日