Webからの観光情報の抽出を行う場合,ソースの種類として,ブログだけではな く,掲示板やマイクロブログも考えられる.掲示板やマイクロブログでは,レスからの情報が断片的であるので,正確な情報 を抽出するためには情報の集約が必要である.
そこで,お土産名や地名の固有表現の抽出,ならびに,お土産などの評判情報の 抽出については個別に抽出できることを前提として,本研究では,掲示板のレス からこれらの断片化された情報を集約することに焦点をあてる.