手順6:列の項目名の求め方

2.1節の手順6におけるクラスタごとの項目名の求め方の概要を図2.4に示す.生成された表の各クラスタについて,以下の手順でクラスタの項目名を付与する.

  1. クラスタに含まれるの各文について,文に含まれる単語のうち品詞が名詞のものを抽出する.
  2. 1で抽出した各単語について,文書頻度を求める.
  3. 文書頻度が最大の単語をクラスタの項目名として付与する.
  4. 文書頻度が最大の単語が複数ある場合は,読点で区切って全て付与する.

Figure 2.4: クラスタの項目名の求め方の例
54#54