next up previous contents
Next: スコアを利用して表の作成 Up: 今後の課題 Previous: 城データ以外の抽出内容   目次


情報抽出の性能向上

本研究で行った[*]節の手法による情報抽出の実験では,Web記事50件中で出現した記事の数が多い上位5つの単語を表の出力としているが,記事頻度以外のパラメータを用いていない. そのため頻度だけではなく,城名と重要項目との単語間の距離を求め頻度に足し込んでから評価を行うなど,新たに頻度以外のパラメータを増やすことによってさらに良い正解率が見込めると考える.



root 2017-03-04