next up previous contents
次へ: 使用する素性一覧 上へ: 手法の提案 戻る: 能動学習を用いたヒント文の自動抽出手法   目次

ヒントの付与

学習データからSVMモデルを作成するために,ブログ文へ人手でヒントの付与を行う.ヒントがある文にはヒントあり(+1),ヒントがない文にはヒントなし(-1)のクラスを付与し,ヒントありの文にはさらにヒントカテゴリを付与する.

ヒントカテゴリとは「自然散策」,「動植物」,「文化歴史」,「神社仏閣」,「街並み」,「施設」,「温泉」,「飲食」,「買い物」,「行事」,「交通」,「スポーツ・アウトドア」,「釣り」,「音楽」,「交流」,「産業」,「その他」の17分類のことであり[1],全てのヒント文にはこれらのうち一つが付与される.

以下にこれらのブログデータの一部を示す.このデータはID番号,ヒント文(+1)か非ヒント文(-1)のクラス,ヒントのカテゴリ,および,文で構成する.


8#8

図: ヒントを付与したブログデータの例
9#9



syahana 平成24年3月14日