next up previous contents
次へ: 能動学習 上へ: 観光開発案のに繋がるヒント文の自動抽出 戻る: SVMの利用による観光地分析   目次

先行研究における自動抽出の手法

まず,ある程度の量の観光ブログ文書を用意する.その各文に対し,人手でヒント文か否かを判定し,それをSVMの学習データとする.次に,分析すべきブログ文をテストデータとしてSVMによる分類を行うことで各文がヒントとなるかどうかの判定を行う.最後に,SVMによる分類結果からいくらかを分析者に提示する.ここまでが自動抽出である.その後,分析者は,提示された文を読みながらヒント分析を行う.この分析結果がこの手法における出力となる.

2.1にこの手法による動作の図を示す.図2.1におけるクラスとは「ヒント文(+1)」と「非ヒント文(-1)」の2値のことであり,スコアとは,SVMによる分類で算出される値である.このスコアはヒントであるか否かの可能性を示しており,スコアが高くなるほどその文がヒントである可能性が高くなる.

図: SVMの利用による自動抽出
6#6



syahana 平成24年3月14日