next up previous contents
次へ: 情緒推定 上へ: 要素技術について 戻る: クラスタリング   目次

キーワード抽出

キーワード抽出とは,対象文書中での登場頻度,互いの繋がりの強さで,重要な単語を抽出することである.一つのキーワード抽出における手法として,TF-IDFがある.TF-IDFは単語の特徴度を計算する.しかし,行動分析のためにキーワードを得るためには,対象と行動の組を得る方が,分かりやすい.ゆえに,共起に注目する.

共起を利用するキーワード抽出にKeyGraph[3]を用いた研究がある.KeyGraphは文書の単語の頻度,および,単語間の共起関係について「土台」,「屋根」,「柱」という考えを用いた.KeyGraphは,これらの考えのもと,文書の主張とその関連語を抽出できる.本研究では,KeyGraphを用いたキーワード抽出を用いる.



平成25年3月17日