実験には,TRECに登録された「情報検索評価用テストコレクションBMIR-J2」 [木谷他木谷他1998] (以下BMIR-J2)を利用する.BMIR-J2は,1994年の毎日新聞より国 際十進分類(UDC)で経済,工学,工業技術一般に分類される記事5,080件を対 象とするもので,文書集合,検索要求,正解判定結果から構成される.検索要求 は「 に関する記事が欲しい」という形式で統一され,「」 の部分にあたる名詞句が列挙されている.また,検索要求に対する正解として, 下記の通り,2種類の記事が示されている.
検索要求を主題としている記事
検索要求の内容を少しでも含む記事