next up previous contents
次へ: 実験 上へ: 行動推移分析支援システム 戻る: 関連行動抽出部   目次

クラスタリング部

クラスタリング部(図2.6)では,関連行動の集合を幾つかに分割するとともに,そのテーマ「ブルーベリー狩り」ブログ記事に概要を表現する.

多くの関連行動を読むことは,分析者に負担である. そこで,まずは,類似する関連行動をいくつかのクラスタに自動分割する. 本稿では,bayon [7] を用いる.bayon は,repeated bisection法でクラスタリングを行なう. 次に,得られたクラスタの概要を把握するためにキーワードの抽出を行なう. 本稿では,KeyGraph [8] を用いる.KeyGraph は,文書の主張とその関連語を抽出することができる. 論文などの文書は,重要語の繰り返しがあることと,重要語にともなう説明文があるため,KeyGraph は有効に動作する. 本稿ではクラスタに対して KeyGraph を試みるため,KeyGraph 本来の用途と少し異なるのだが, 簡便であり,類似研究[9]で使われていることから,試行する.

関連行動抽出部より受けとったデータを,クラスタリングのためにベクトル化する. クラスタリング時のベクトル化では,素性として,名詞・動詞の単語uni-gram,および,意味属性コード[12]を用いる. 次に,ベクトル化された関連行動集をbayonを使用して,8つにクラスタリングする. 作成された8つのクラスタに対してKeyGraphを使用し,各クラスタごとのネットワーク図を作成する. 最後に,クラスタリングされた関連行動集とネットワーク図を出力する.

図: クラスタリング部
\includegraphics[width=16cm]{clustering.eps}



平成24年3月13日