next up previous contents
次へ: 教師データ作成 上へ: 実験 戻る: 法則内容分割   目次

情報タグ候補の決定

[*]節に示した方法によって,抽出した法則のページから情報タグの候補を獲得した. 本研究では,十分な推定教師データが作成できるように,頻度の高いセクション名を情報タグの 候補とする. 表[*]に頻度順のセクション名とその頻度を示す. この表の上位の頻度を持つセクション名が,情報タグの候補となる.

本研究では,この表の上位頻度のセクション名の中でも, 法則のページの主要な分類であろう [歴史][証明][例][定義]に関して情報タグの付与を行い,評価を行うこととした.


  • 情報タグ候補
  • 表: 情報タグ候補

    セクション名 頻度
    関連項目 1755
    外部リンク 758
    参考文献 716
    概要 534
    脚注 407
    歴史 159
    定義 121
    119
    構成 76
    概説 64
    証明 57
    出典 55



    平成23年3月2日