next up previous contents
次へ: 目次 上へ: honron 戻る: honron   目次

概要

近年,体験型の観光が注目されている.体験型観光の一つにフルーツ狩りがある.鳥取県においては,梨狩りやブルーベリー狩りなど農業と観光の連携がその一つである.農業従事者や旅行エージェントらは注目の高まっている体験型観光に対して,旅行者により良いサービスを提供するために旅行者の意見や感想を知る必要がある.分析者は旅行者のフルーツ狩りの最中,あるいはその前後の行動を分析することが必要となる.ここで,旅に関するブログ記事に注目すると,旅行者が多くの体験談を記述している.ゆえに,ブログ記事は行動を分析する対象となる.ブログ記事を閲覧すると,ブログ記事にはフルーツ狩りと無関係な記述を見かける.また,ブログ記事の話題に統一性がない.そこで,先行研究[1]は,「ブルーベリー狩り」に焦点を当て,ブログ記事を類似する体験談にまとめた.さらに,分析に必要な体験談に絞り閲覧するために,動詞を素性に利用したクラスタリングを用いた.しかし,この方法では,ブルーベリー狩りと無関係な記述が混ざることが多く,分析者は余分な文章を読まなければならない.一方,近年,トピックに基づく分類(LDA;Latent Dirichlet Allocation)が用いられている[2].LDAは文書素性の次元圧縮に利用可能である.そこで,本研究では,ブルーベリー狩りの行動分析タスクにおいて「LDAにおけるトピックを素性に利用する方法」と「動詞を素性に利用する方法」との比較調査を目的とする.

以上について,「動詞を素性に利用する方法」と「LDAにおけるトピックを素性に利用する方法」との比較調査を行った.その結果,本研究では明らかにブルーベリー狩りとは無関係なクラスタを3件(255文)にまとめることができた.一方,先行研究では,1件(78文)であった.本研究で,トピックを素性に利用することで,分析者の分析効率が高まったことが確認できた.この結果は,「動詞を素性に利用する方法」と比較して,「ブルーベリー狩り」と明らかに無関係な文がまとまっており,分析する際の効率を高めた.また,得られた分析内容を比較した.概ね同様の分析内容を残していることを確認できた.以上により,分析者が読む量を減らせた.また,分析内容は保たれた.



平成25年3月17日