next up previous contents
次へ: 特徴度ごとのヒント数集計結果 上へ: 分類の評価 戻る: ヒントの付与結果   目次

比較する分類手法

本手法における名詞の特徴度を評価するため,以下の2つの手順の結果を比較する. 分類手法Aは長所情報のみを利用した名詞の特徴度を,分類手法Bはブログ全文を 利用した名詞の特徴度を用いている.

○分類手法A

  1. 長所情報に特徴度を付与
  2. 特徴度ごとにヒント数を集計
  3. 集計結果をヒストグラム化

○分類手法B

  1. 類似する観光地3つのブログ全文をそれぞれ文集合$D_1,D_2,D_3$として 第4.2.1節の手法で特徴語と特徴度を取得
  2. 各観光地のブログ全文を3文ごとに分割
  3. 3文単位に分割した情報に1.で取得した特徴度を付与
  4. 特徴度ごとにヒント数を集計
  5. 集計結果をヒストグラム化

長所情報に特徴度を付与する作業について説明する.長所情報を構成する3文に 含まれる特徴語の内,最も高い特徴度の値をその情報の特徴度とする.図 6.2に示したの例の場合,長所情報は複数の特徴語を含むが,最 も特徴度の高い特徴語「しらす」の特徴度「1.233」を長所情報E00127〜E00129 の特徴度とする.分類手法Bにおける3.の作業も同様に行う.

図 6.2: 長所情報に対する特徴度の付与例
\begin{figure}\begin{center}
\begin{tabular}{rl}
\hline
E00127 & 事前にぴの字...
...にはすでに順番待ちの行列。 \\
\hline
\end{tabular}
\end{center}\end{figure}

特徴度付与後,特徴度ごとにヒントの出現数を集計し,分類手法Aと分類手法Bを 比較する.



平成23年3月1日