そこで,本研究では,対象を明確にするため, 本文部へのコメントであるか,あるいは, 別の先行するいずれのコメント部へのコメントであるか というブロックの単位でのコメント先の解析を行う. 関連文の類似度を計算する方法の一つとして,荒牧らは,単語 n-gram に対して Okapi-BM25 を用いた.そこで,関連研究の対応付けの方法の他に,ブログ記事の慣習的特徴を利用する手法,および, ブログの意図伝達に着目する手法を決定リストで組み合わせた手法を利用してコメント先解析システムを作成した.
Amebaブログからランダムに収集したブログ記事32件,ブロック数255件,コメント元件数は224件を利用して,人手により作成した正解データと解析システムによる出力を比較した. その結果,適合率 ,再現率 , 値 という性能評価を得た.