上記の素性データをベクトル化することによりSVMモデルを作成し,学習および分類に使用する.分類後のデータはスコア順にソートを行う.表4.3に使用したプログラム一覧を示す.図4.3にはSVMによるヒントの分類結果の例を示す.このデータは,SVMによる分類スコア,文ID,ブログ文で構成される.
プログラム名 | 概要 |
(MySVM.rb) | TinySVMを使用し,素性データの学習および分類を行うプログラム |
sort.rb | スコアデータのソートを行うプログラム |
var.rb | SVMの分類結果から適合率,再現率,F値を求めるプログラム |
solveroc.rb | カテゴリ再現率(後述)を求めるプログラム |
makemodel.sh | 学習モデルを作成するプログラム |
auto_var.sh | これらのプログラムを使用し,能動学習を行うプログラム |
18#18