本研究での変遷情報とは,変遷の関係にある2つの法則名および各発見年による組と定義する. たとえば, 「1670年に発見された決定理論を基に,1928年にゲーム理論が提唱された」 という文では, 『「決定理論(1670)」「ゲーム理論(1928)」』という組を1つの変遷情報とする. 変遷の関係である法則対と変遷の関係でない法則対を一つずつ表に示す.
変遷情報の抽出は法則年号の抽出処理と法則対の抽出の2つで構成する. 変遷情報の抽出は以下のとおりに行う. 法則ページ(法則を記載したページ)に記載されている年号より各法則の発見年を予測し, ある法則Aのページに他の法則Bが記載されている場合に 法則Aと法則Bが変遷の関係にある可能性が高いとする ヒューリスティックルールに基づき, 法則Aと法則Bの対をそれぞれの法則の発見年 とともに変遷情報として抽出する. 変遷情報の抽出手法として,ヒューリスティックルール,および,教師あり機械学習に基づく手法を提案する. なお,教師あり機械学習には性能の優れたサポートベクターマシン(SVM)を利用する. ヒューリスティックに基づく手法の性能を向上させるために,教師あり機械学習 を用いて性能を向上させる.
法則の変遷情報の抽出の意義には以下のものがある. 法則の変遷情報は,法則の基本的な情報であり, 収集し整理できると法則間の関係をより理解しやすくなる. また,科学の発展の歴史を整理することにも役立つ.
本研究の主な主張点は以下のとおりである.
本論文の構成は以下の通りである.第2章では関連研究を説明する. 第3章では,提案手法,抽出の手順について述べる. 第4章では,実験データおよび実験の結果について述べる. 第5章では,機械学習で利用した素性について分析を行う. 第6章では,Wikipediaにおける法則以外の変遷に対する調査を行う. 第7章では,今後の課題を挙げる. 第8章では,全体をまとめる.