次へ: 抽出結果
上へ: 国内観光情報サイトからの抽出
戻る: 抽出方法
目次
ブログ記事に記述される際の表記のゆれに対応するため,抽出した手がかり語に対し,以下のルールを適用する.
- アルファベットおよび記号が含まれている手がかり語は,アルファベットおよび記号が全角のものと半角のものの両方を手がかり語辞書に登録
- スペースが含まれる施設名は,スペースで区切ったそれぞれと,スペースを削除して詰めたものをそれぞれ手がかり語辞書に登録
例として「わかさ氷ノ山 自然ふれあいの里」という手がかり語の場合,
「わかさ氷ノ山」,「自然ふれあいの里」,「わかさ氷ノ山自然ふれあいの里」という3つの単語に加工して,それぞれを手がかり語に登録する.
平成23年3月3日