next up previous contents
次へ: 関連行動抽出部 上へ: 行動推移分析支援システム 戻る: 体験表現辞書   目次

ブログ収集部

ブログ収集部(図2.4)では,分析者が入力したテーマを検索キーとして,一般の検索サイトを通じてブログ記事を検索する.

ここで,「ブルーベリー狩り」をテーマに検索すると,「ブルーベリー狩り」を体験していない記事もヒットする. たとえば,「試験が終ったら,ブルーベリー狩りに行きたいなぁ.」という文にヒットする場合である. したがって,ブログ記事のタイトルにテーマが含まれることを条件に,記事の絞り込みを行なうという選択肢を用意している.

収集した記事は,文の境界を自動判別しながら記事ごとに格納する.

分析者より入力されたテーマを用いて,ブログ検索サイトの検索を行なう. ブログ検索の結果より,テーマに関するブログ記事のURLを取得し,URLリストを作成する. その後,取得したURLのブログ記事を解析して,記事の本文部分のみを行ごとに取得する. URLリストの全てのブログ記事本文を格納した出力データを作成する.

図: ブログ収集部
\includegraphics[width=14cm]{brog.eps}



平成24年3月13日