next up previous contents
次へ: 素性の抽出 上へ: 実装 戻る: 実装   目次

ブログデータの収集

ブログデータの収集は[1]で使用されたプログラムを参考に作成した各種プログラムを用いて行った.以下にブログデータの収集に用いたプログラムの一覧および収集したブログデータの例を示す.収集したブログデータについてもその例を示す.


表: ブログデータ収集プログラム一覧
プログラム名 概要
geturl_yahoo.rb 入力したキーワードからブログのURLを抽出するプログラム
yahoo_article_extract.rb URLリストからブログ文を,ID番号を付与して収集するプログラム
border.rb ブログ文を記事単位に分割するプログラム


16#16

図: ブログデータの例
9#9



syahana 平成24年3月14日