next up previous contents
次へ: クラスタリング部 上へ: 行動推移分析支援システム 戻る: ブログ収集部   目次

関連行動抽出部

関連行動抽出部(図2.5)では,ブログ記事から,体験表現を含む部分を検索する.

ブログ記事の1文ずつを切り出したのでは,体験の様子が想像しにくい. そこで,体験表現を含む文(以降,体験表現文と呼ぶ),および,その前後文の3文を1セットとして抽出する. こうして得られたセットを,テーマに関連する行動の情報とみなし,「関連行動」と呼ぶこととする.

関連行動は,テーマの記述の前に出現したものと,テーマの記述の後に出現したものとに分けて格納する. これにより,テーマの前に行なう行動か,後に行なう行動かを区別する.

たとえば,「ブルーベリー狩り」をテーマとするとき,「旅行者がブルーベリー狩りの前にどんなことをしているのか, ブルーベリー狩りの後にどんなことをしているのか」ということを分析できると予想している.

ブログ収集部より受けとったデータと,体験表現辞書とのマッチングを行い,体験表現文を取得する. 取得した体験表現文に,前後一文を結合して,関連行動を作成する. 関連行動は,ブログ記事中のテーマの記述より前から取得したか,後から取得したかで,別の出力データを作成する.

図: 関連行動抽出部
\includegraphics[width=16cm]{kannrenn.eps}



平成24年3月13日