next up previous contents
次へ: 関連研究 上へ: honron 戻る: 表一覧   目次

はじめに

近年Wikipediaというオンライン百科事典が世界中で広く利用されており, Wikipediaに関する様々な研究がなされている. Wikipediaというオンライン百科辞典には,多くの法則が収録されている. 法則には別の法則から発見されるという変遷があり, 読者は法則の変遷を知ることで法則の理解を深めることができる. そこで,本研究では法則の変遷についての情報を Wikipedia から自動抽出することを目的とする.

本研究での変遷情報とは,変遷の関係にある2つの法則名および各発見年による組と定義する. たとえば, 「1670年に発見された決定理論を基に,1928年にゲーム理論が提唱された」 という文では, 『「決定理論(1670)」「ゲーム理論(1928)」』という組を1つの変遷情報とする. 変遷の関係である法則対と変遷の関係でない法則対を一つずつ表[*]に示す.


表: 変遷情報の候補
法則A 法則B 結果
決定理論(1670年) ゲーム理論(1928年) 変遷情報
擬似乱数(1948年) 制御理論(1950年) 非変遷情報

変遷情報の抽出は法則年号の抽出処理と法則対の抽出の2つで構成する. 変遷情報の抽出は以下のとおりに行う. 法則ページ(法則を記載したページ)に記載されている年号より各法則の発見年を予測し, ある法則Aのページに他の法則Bが記載されている場合に 法則Aと法則Bが変遷の関係にある可能性が高いとする ヒューリスティックルールに基づき, 法則Aと法則Bの対をそれぞれの法則の発見年 とともに変遷情報として抽出する. 変遷情報の抽出手法として,ヒューリスティックルール,および,教師あり機械学習に基づく手法を提案する. なお,教師あり機械学習には性能の優れたサポートベクターマシン(SVM)を利用する. ヒューリスティックに基づく手法の性能を向上させるために,教師あり機械学習 を用いて性能を向上させる.

法則の変遷情報の抽出の意義には以下のものがある. 法則の変遷情報は,法則の基本的な情報であり, 収集し整理できると法則間の関係をより理解しやすくなる. また,科学の発展の歴史を整理することにも役立つ.

本研究の主な主張点は以下のとおりである.

本論文の構成は以下の通りである.第2章では関連研究を説明する. 第3章では,提案手法,抽出の手順について述べる. 第4章では,実験データおよび実験の結果について述べる. 第5章では,機械学習で利用した素性について分析を行う. 第6章では,Wikipediaにおける法則以外の変遷に対する調査を行う. 第7章では,今後の課題を挙げる. 第8章では,全体をまとめる.



平成25年10月10日