next up previous contents
次へ: 変遷情報 上へ: thesis5 戻る: 図一覧   目次

はじめに

物事の変遷を知ることは,その物事の知識を会得する際に重要なことである. 変遷を知るためには一般的にWebや検索エンジン, または書籍を使用して情報を得る方法があげられるが, これらの方法では人手では網羅的に収集することが困難であり,かつ多大な労力を要する. 変遷を知ることを自動で簡単に行うことができれば非常に便利である.

堀らは[1]その手始めとして, 論文のタイトル,著者名のデータを使用し,分野の変遷関係, 人物の変遷関係(いわゆる先生と弟子のような関係)を 自動で推定した.次に,Fanら[2]は法則の変遷情報をWikipediaから抽出した. 法則ページ(法則を記載したページ)に記載されている年号より各法則の発見年を予測し, ある法則Aのページに他の法則Bが記載されている場合に法則Aと法則Bが 変遷の関係にある可能性が高いとするヒューリスティックルールに基づき, 法則Aと法則Bの対をそれぞれの法則の発見年とともに変遷情報として抽出した.

これらの研究は,問題点として学術分野間,師弟間,法則間という限定された変遷情報の種類についての抽出であったことが挙げられる. そこで,本研究では,より多くの種類の変遷情報を自動で, より高性能で取得することを大きな目的とする.

この目的を達成するため,本論文では,以下の研究を行う.

  1. 大量の文から人手で作成したパターンを利用し,変遷情報を自動で抽出する.また,教師あり機械学習を追加してより高性能に変遷情報の抽出を行う.(4章)
  2. 1で抽出した変遷情報は何についての変遷かわからないため,1で抽出した変遷情報を人手で分類し,分析する.(5.1節)
  3. 機械学習を利用して変遷情報の自動分類も行う.(5.2節)

本研究の主張点を以下に整理する.



平成25年3月13日