次へ: 特徴度ごとのヒント数集計結果
上へ: 分類の評価
戻る: ヒントの付与結果
目次
本手法における名詞の特徴度を評価するため,以下の2つの手順の結果を比較する.
分類手法Aは長所情報のみを利用した名詞の特徴度を,分類手法Bはブログ全文を
利用した名詞の特徴度を用いている.
○分類手法A
- 長所情報に特徴度を付与
- 特徴度ごとにヒント数を集計
- 集計結果をヒストグラム化
○分類手法B
- 類似する観光地3つのブログ全文をそれぞれ文集合として
第4.2.1節の手法で特徴語と特徴度を取得
- 各観光地のブログ全文を3文ごとに分割
- 3文単位に分割した情報に1.で取得した特徴度を付与
- 特徴度ごとにヒント数を集計
- 集計結果をヒストグラム化
長所情報に特徴度を付与する作業について説明する.長所情報を構成する3文に
含まれる特徴語の内,最も高い特徴度の値をその情報の特徴度とする.図
6.2に示したの例の場合,長所情報は複数の特徴語を含むが,最
も特徴度の高い特徴語「しらす」の特徴度「1.233」を長所情報E00127〜E00129
の特徴度とする.分類手法Bにおける3.の作業も同様に行う.
図 6.2:
長所情報に対する特徴度の付与例
|
特徴度付与後,特徴度ごとにヒントの出現数を集計し,分類手法Aと分類手法Bを
比較する.
平成23年3月1日