next up previous contents
次へ: 法則ページの抽出 上へ: 実験 戻る: 実験   目次

前処理

実験には,Wikipediaから2010年5月26日にダウンロードしたWikipediaの日本語ページを利用する. そのデータに対し以下の手順で前処理を行う.

手順1
ダウンロードしたページに対し,法則ページの抽出を行う.
手順2
抽出した法則ページのデータから,法則ページごとのタイトル名を抽出し,法則名リストを作成する.
手順3
抽出した法則ページのデータから,手順2で作成した法則名リストを用いて, 法則ページにある基本法則と関連法則の対を抽出し,法則対リストを作成する.



Subsections

平成25年10月10日