次へ: 実験 上へ: 行動推移分析支援システム 戻る: 関連行動抽出部目次

クラスタリング部

クラスタリング部（図2.6）では，関連行動の集合を幾つかに分割するとともに，そのテーマ「ブルーベリー狩り」ブログ記事に概要を表現する．

多くの関連行動を読むことは，分析者に負担である．そこで，まずは，類似する関連行動をいくつかのクラスタに自動分割する．本稿では，bayon [7] を用いる．bayon は，repeated bisection法でクラスタリングを行なう．次に，得られたクラスタの概要を把握するためにキーワードの抽出を行なう．本稿では，KeyGraph [8] を用いる．KeyGraph は，文書の主張とその関連語を抽出することができる．論文などの文書は，重要語の繰り返しがあることと，重要語にともなう説明文があるため，KeyGraph は有効に動作する．本稿ではクラスタに対して KeyGraph を試みるため，KeyGraph 本来の用途と少し異なるのだが，簡便であり，類似研究[9]で使われていることから，試行する．

関連行動抽出部より受けとったデータを，クラスタリングのためにベクトル化する．クラスタリング時のベクトル化では，素性として，名詞・動詞の単語uni-gram，および，意味属性コード[12]を用いる．次に，ベクトル化された関連行動集をbayonを使用して，8つにクラスタリングする．作成された8つのクラスタに対してKeyGraphを使用し，各クラスタごとのネットワーク図を作成する．最後に，クラスタリングされた関連行動集とネットワーク図を出力する．

図: クラスタリング部
$\includegraphics[width=16cm]{clustering.eps}$

平成24年3月13日