next up previous contents
Next: 評価方法 Up: 実験 Previous: 実験   目次

実験条件

本研究では,Wikipediaの城に関する記事を入力として[*]節の手法で情報抽出を行い,記事中の記載不備を検出するための表を作成する. なお,本研究ではその表として,先行研究である藤原[1],赤野[2]の研究結果を用いる.

[*]節の手法では検索エンジンにより得られたWebの情報を用いて,Wikipediaの記事中の記載不備を修正しやすくするための表を作成する. [*]節の手法の性能評価のために,以下の2種類の実験を行う.

ただし,表の全ての箇所に対して検索エンジンを用いて情報抽出する実験は,Web文書からの情報抽出の性能を見るために行う実験である.

Wikipedia(2014年11月)の城ページ(2,665ページ)に対して[*]節や[*]節や[*]節の手法を用いて情報抽出と表の作成を行った. また,2,665件の城ページのうちランダムに選んだ30件の城名を検索エンジンにそれぞれ入力して記事を取得し,この30件の城データで[*]節の手法の実験と評価を行った. なお本研究で用いる検索エンジンはMicrosoft社のBingSearchAPI[11]である.



root 2017-03-04