次へ: 調査の結果
上へ: Wikipediaにおける法則以外の変遷に対する調査
戻る: Wikipediaにおける法則以外の変遷に対する調査
目次
調査の手順は以下のとおりである.
- 手順1
- 実験データとして Wikipedia から2012年10月27日時点の全日本語ページ(9GB)をダウンロードする.
- 手順2
- ダウンロードしたページに対し,その内訳(年号を含むページの数,年号が最初の段落に出現したページの数)を調査する.
- 手順3
- ダウンロードしたWikipediaのページをカテゴリごとに分類し,各カテゴリに属するページの数を求め,
カテゴリの一覧表を作成する.
- 手順4
- 一覧表の上位にある代表的なカテゴリを選び,法則の変遷情報の抽出で提案したヒューリスティックルールに基づく手法
を用いて,機械でカテゴリごとの変遷情報を抽出する.
- 手順5
- 抽出したカテゴリごとの変遷情報をランダムに10件ずつ取りだし,人手評価を行う.
平成25年10月10日