次へ: 謝辞
上へ: honron
戻る: 今後の課題
目次
本研究ではWikipediaから法則の変遷情報を抽出する手法を提案した.
ヒューリスティックルールと
教師あり機械学習に基づく手法を用いて変遷情報の抽出を行った.
ヒューリスティックルールは,
法則ページの先頭の年号を法則年号とし,
基本法則と関連法則の対を変遷情報として取り出す
というものである.
実験の結果,変遷情報の抽出ではヒューリスティックルールに基づく
簡単な手法でもF値0.46を得た.
ヒューリスティックルールに加え
教師あり機械学習を利用する手法でF値0.68を得た.
法則年号を取り出さなくてよく,変遷の関係に
ある法則対を取り出すという目的では,
教師あり機械学習手法でF値0.87を得た.
また,提案手法の汎用性を検証すべく,提案手法を用いて法則以外のものの変遷情報の抽出を試みた.
その結果,提案手法は法則以外のものの変遷情報の抽出に応用可能であることがわかった.
最後に,情報抽出の評価基準,可視化ツールの作成,
実験データの人手判定,素性の実験,法則以外の実験,パッケージ化
を今後の課題として取り上げたいと考える.
平成25年10月10日