次へ: 評価方法
上へ: 実験
戻る: 実験
目次
テストデータは,Amebaブログ[6]からブログ記事を抽出して作成する.
コメント先の正解データは,人手で作成する.
ブログ記事の抽出において,次の点に注意する.
- 内容のあるコメントが書かれている(たとえば,「ペタ」と呼ばれるブログ閲覧の形跡のみに関するコメントは内容が無い)
- Amebaブログのジャンル別ランキングを参照し,異なる複数のジャンルからテストデータを構成する
テストデータは,ブログ記事32件から作成した.
ブログ本文部とコメント部によるブロックの数は,255件であった.
第一コメントのコメント先は必ずしもブログ本文部とは限らない.
例えば,著者と知り合いの人がブログ記事に書かれていない情報についてコメントしている場合などが挙げられる.
従って,テストしたコメント元の件数は224件である.
一方,正解のコメント先の数(理想的なコメント先の数)は,223件である.
平成23年4月13日