next up previous contents
次へ: 関連研究 上へ: honron 戻る: 表一覧   目次

はじめに

近年,都道府県等の地方公共団体において観光立県宣言がなされる例があるように,観光開発の重要性に対する認識が高まっている.観光開発とは,観光客が訪れることが少ない観光地の利用の促進のために旅行関係施設の配置や整備を行うことである.このような地域では,訪れる観光客が持つ親睦,休養,見物といった様々な目的を満たすことが可能で,かつその地域の特色を生かすことができるような適切な観光開発案が求められており,このような案は実際に旅行を行った観光客の旅日記から開発に関するヒントを発見することができると考えられる.

このような観光地開発のヒントを得るために,ブログ記事を分析する研究が行われている[1].しかし,ブログ記事の全てが観光開発のヒントとなるわけではないため,分析者の負担を軽減するためにブログ文からヒントとなる文を自動抽出できることが望まれる.その抽出方法の1つとしてSVM(Support Vector Machine)を用いる方法がある[2].しかし,この方法における自動抽出の精度を高めることが課題となっている.

ここで,ブログ記事のヒント分析を進めると自然に正例と負例が得られるので,これをSVMの学習データに追加して再学習し,残りの分析対象を再分類するという手法が対策として考えられる.そこで本研究では,能動学習の手法を用いることにより分析精度を向上させ,分析者の負担を軽減させることを目的とする.

本研究におけるヒント分析とは,分析者がある観光地Aの開発案を考えるために観光地Bに関するブログを分析することである.これにより新しい発想を得ようとしている.例えば,「山陰海岸」の観光開発を行う時に,類似の観光地である「三陸海岸」に関するブログを分析するとしよう.その結果「遊歩道から断崖絶壁を登った」という文があった場合,三陸海岸では遊歩道を整備することで観光客の満足度を高めることができたと解釈される.こうした良い開発を山陰海岸においても行うべきだという発想が生まれる.このような発想を生んだ文は開発のヒントとなった文である.

本研究における分析支援とは,このような観光開発の発案に繋がる文(ヒント文)を自動抽出するということである.具体的には,ある程度のブログ文を抽出し,その中から観光開発のヒントである文とそうでない文を自動的に分類する.その中からヒントであると推測される文を分析者に提示することで,ヒントではないと思われる文,すなわち読む必要のない文を削減する.こうして分析者が分析する文の量を減らし,負担を軽減することができる.本研究における観光開発のヒントとはこのような文であり,以降このような文をヒント文と呼ぶことにする.

第2章ではこれまでに行われた観光開発の研究およびこの研究に取り入れる能動学習に関する研究の説明を行う.第3章では,能動学習を観光開発に取り入れる手法の説明を行う.第4章では,分析対象となるブログデータの利用法に関する説明を行う.第5章では,実際にどのように自動抽出および性能評価を行うかの説明を行う.第6章では,従来手法と提案手法の評価結果の比較を行う.第7章では評価結果からどのように能動学習が有効かの考察を行う.第7章ではまとめを行う.



syahana 平成24年3月14日