学習データからSVMモデルを作成するために,ブログ文へ人手でヒントの付与を行う.ヒントがある文にはヒントあり(+1),ヒントがない文にはヒントなし(-1)のクラスを付与し,ヒントありの文にはさらにヒントカテゴリを付与する.
ヒントカテゴリとは「自然散策」,「動植物」,「文化歴史」,「神社仏閣」,「街並み」,「施設」,「温泉」,「飲食」,「買い物」,「行事」,「交通」,「スポーツ・アウトドア」,「釣り」,「音楽」,「交流」,「産業」,「その他」の17分類のことであり[1],全てのヒント文にはこれらのうち一つが付与される.
以下にこれらのブログデータの一部を示す.このデータはID番号,ヒント文(+1)か非ヒント文(-1)のクラス,ヒントのカテゴリ,および,文で構成する.
8#8