next up previous contents
次へ: 推定教師データ 上へ: 支援の必要性 戻る: F値からの考察   目次

情報タグ付与結果からの考察

Wikipediaの法則に関連するページ20,001セクション対して,手作業で教師データを用いたSVMによって「:歴史」の情報タグを付与した. 結果を表[*]に示す. 『「:歴史」タグ数』は,法則に関連するページに付与された情報タグ「:歴史」の数, 『セクション名「歴史」総数』はセクション名「歴史」の数,『「:歴史」+「歴史」数』 は情報タグ「:歴史」が付与されたセクション名「歴史」の数である. もとからセクション名「歴史」と記載されているセクションには,約半数,情報タグ「:歴史」を ふることができていることがわかる. 表[*]に再現率,適合率から,情報タグの正解数,法則に関連するセクション20,001個中の情報タグの正解数と歴史の情報を含むセクション数を予測した値を示す. これらの結果から,既存のセクション名を手掛かりに歴史情報を探した場合,全体の14%程度しか 得ることができないため,効率の良い情報収集が困難であることが明らかになった.
  • 情報タグ付与結果
  • 表: 情報タグ付与結果

      個数
    セクション総数 20,001
    「:歴史」タグ数 4,385
    セクション名「歴史」総数 306
    「:歴史」+「歴史」数 153


  • 法則関連ページ予測数
  • 表: 法則関連ページ予測数

      予測数
    正解「:歴史」タグ数 2,161
    歴史の情報を含むセクション 2,680



    平成23年3月2日