next up previous contents
Next: 実験環境 Up: 文の分割方法 Previous: 重要度の計算方法   目次


クラスタの項目名の求め方

3.1節の手順5におけるクラスタごとの項目名の求め方の概要を図3.5に示す. 生成された表の各クラスタについて,以下の手順でクラスタの項目名を付与する.
  1. クラスタに含まれるの各文について,文に含まれる単語のうち品詞が名詞のものを抽出する.
  2. 1で抽出した各単語について,文書頻度を求める.
  3. 文書頻度が最大の単語をクラスタの項目名として付与する.
  4. 文書頻度が最大の単語が複数ある場合は,読点で区切って全て付与する.
図 3.5: クラスタの項目名の求め方の例
\includegraphics[width=12cm]{koumoku.eps}



2018-03-02