この章では,能動学習を観光地分析に取り入れる手法についての説明を行う.まずは[2]で行われた,SVMを利用することによる基本的な手法についての説明を行う.
図3.1に能動学習を用いた手法による動作の図を示す.まず,基本的な手法と同様に学習および分類を行う.次に,スコアでソートされた文に対し,スコアが高い文からその文がヒントであるかどうかの判別を分析者が行う.その結果を元の学習データに追加して再学習を行う.その後,残りの文を再分類し,再分類結果により抽出した文の分析を行う.再学習前に分析したものと再学習後に分析したものすなわち図3.1における二重四角の部分を合わせたものがこの手法の出力となる.
ここで,再学習のために抽出する手法は幾通りか考えられる.例えば,[3]ではスコアの絶対値が小さいものを優先的に抽出していた.しかし,その手法では,ヒントになりにくい文を分析者に提示することになる.本稿では,観光開発のヒントを得るための分析を主としており,能動学習は,その分析作業の副産物として機能するものとしたい.したがって,本稿では,スコアの高いものから順に抽出するという手法を選択する.