next up previous contents
次へ: スパースさについての考察 上へ: 意味属性頻度からのスパースさ調査 戻る: 用言のスパースさの調査結果   目次

名詞のスパースさ調査結果

次に,名詞に関する結果を表7に示す.カテゴリ名は上からダウンロードデー タ量の多い順に並んでおり,カテゴリ名は略称となっている.


表 7: 各カテゴリの名詞の意味属性カバー率
カテゴリ名 解析後文数 閾値100 閾値500 閾値1,000
健康 1,459,137 98% 95% 92%
ビジネス 1,528,314 97% 94% 88%
各種資料 1,201,811 97% 94% 89%
メディア 1,117,581 97% 94% 90%
生活 914,820 97% 94% 89%
社会科学 919,366 97% 91% 85%
エンター. 838,258 97% 93% 84%
趣味 768,074 97% 91% 87%
教育 489,500 96% 89% 80%
地域情報 613,197 95% 89% 84%
政治 444,104 95% 86% 79%
自然科学 538,653 96% 87% 80%
芸術 528,302 96% 86% 80%
コンピュ. 432,558 93% 81% 73%

全体的に用言よりも高いカバー率だった.閾値1,000では趣味のカテゴリは期待 よりも高く,教育は低いカバー率となった.コンピュータはデータ量が少ないこ ともあってほかに比べると極端に低い.


next up previous contents
次へ: スパースさについての考察 上へ: 意味属性頻度からのスパースさ調査 戻る: 用言のスパースさの調査結果   目次
平成18年5月30日