next up previous contents
次へ: 抽出方法 上へ: 国内観光情報サイトからの抽出 戻る: 国内観光情報サイト「大好き日本」とは   目次

HTMLファイルのダウンロード

国内観光情報サイト「大好き日本」より,各都道府県ごとの観光情報が記述されているHTMLファイルをダウンロードした. 本研究で用いるHTMLファイルは,2009年9月3日にダウンロードを行ったものである.

国内観光情報サイトよりHTMLファイルのダウンロードを行ったカテゴリを,図[*]に示す.

図: HTMLファイルのダウンロードを行ったカテゴリ
\begin{figure}\begin{center}
\begin{tabular}{\vert c\vert c\vert c\vert} \hline
...
...line
街歩き & お祭り & 日本百選  \hline
\end{tabular}\end{center}
\end{figure}

[*]に示されているカテゴリに属する観光情報から,施設名やランドマーク名,イベント名などを抽出する.



平成23年3月3日