next up previous contents
次へ: 関連研究 上へ: honron 戻る: 表一覧   目次

はじめに

近年Web上で個人の情報発信が容易となるに伴い,テキストマイニングに関する 研究が盛んに行われるようになった.Kanayamaら[1]は,製品やサー ビスに対する消費者の要求を,要望表現パターンにより抽出する手法を提案した. また木村ら[2] は,住民の政治的関心をブログ記事から分析し,議員 活動への民意の反映を支援するシステムを提案した.一般公開されているシステ ムとしては,gooの評判分析 1がある.

このように,Web上の文書から情勢や動向を把握するための情報は多種多様であ り,情報を探す立場においては,抽出する情報を取捨選択しなければならない. 上記のシステムでは,抽出する情報として意見や評判,要望に注目している.本 研究では,意見や評判などの価値判断をもっとも抽象的につかむ基準である``情 緒''に着目する.例えば,製品やサービス,政治などをトピックとし,トピック に対する``情緒'' の分布を得ることによって,より詳細な情報を得るための指 針となる.トピックに対する``情緒''の分布は,Web上にある一般的なサイトに おける``情緒''の分布と比較することにより,特定の``情緒'' に偏っているか どうかが分かる.しかし,Web上にある一般的なサイトにおける``情緒''の分布 はまだ調査されていない.

本研究では,かねてより作成していた情緒属性付き結合価パターン辞書 [10][11]を用いて,Web 上の一般サイトにおける``情緒''の 分布,および ``情緒''と共起しやすいキーワードの分布を調査するシステムを 試作する.

本論文の構成は以下の通りである.第2章では関連研究について述べる.第3章で は本研究で提案するシステムの概要 について述べる.第4章でWebドキュメントの収集と前処理について,第5章では 情緒推定について,第6章では出力についてそれぞれ述べる.第7章ではシステム の評価および有用性について考察する.第8章ではまとめを述べる.



平成21年3月23日