next up previous contents
次へ: 調査の結果 上へ: Wikipediaにおける法則以外の変遷に対する調査 戻る: Wikipediaにおける法則以外の変遷に対する調査   目次

調査の手順

調査の手順は以下のとおりである.
手順1
実験データとして Wikipedia から2012年10月27日時点の全日本語ページ(9GB)をダウンロードする.
手順2
ダウンロードしたページに対し,その内訳(年号を含むページの数,年号が最初の段落に出現したページの数)を調査する.
手順3
ダウンロードしたWikipediaのページをカテゴリごとに分類し,各カテゴリに属するページの数を求め, カテゴリの一覧表を作成する.
手順4
一覧表の上位にある代表的なカテゴリを選び,法則の変遷情報の抽出で提案したヒューリスティックルールに基づく手法 を用いて,機械でカテゴリごとの変遷情報を抽出する.
手順5
抽出したカテゴリごとの変遷情報をランダムに10件ずつ取りだし,人手評価を行う.



平成25年10月10日