多くの関連行動を読むことは,分析者に負担である. そこで,まずは,類似する関連行動をいくつかのクラスタに自動分割する. 本稿では,bayon [7] を用いる.bayon は,repeated bisection法でクラスタリングを行なう. 次に,得られたクラスタの概要を把握するためにキーワードの抽出を行なう. 本稿では,KeyGraph [8] を用いる.KeyGraph は,文書の主張とその関連語を抽出することができる. 論文などの文書は,重要語の繰り返しがあることと,重要語にともなう説明文があるため,KeyGraph は有効に動作する. 本稿ではクラスタに対して KeyGraph を試みるため,KeyGraph 本来の用途と少し異なるのだが, 簡便であり,類似研究[9]で使われていることから,試行する.
関連行動抽出部より受けとったデータを,クラスタリングのためにベクトル化する.
クラスタリング時のベクトル化では,素性として,名詞・動詞の単語uni-gram
,および,意味属性コード[12]を用いる.
次に,ベクトル化された関連行動集をbayonを使用して,8つにクラスタリングする.
作成された8つのクラスタに対してKeyGraphを使用し,各クラスタごとのネットワーク図を作成する.
最後に,クラスタリングされた関連行動集とネットワーク図を出力する.