next up previous contents
Next: 実験 Up: 上位下位知識 Previous: 上位下位知識   目次

頻度分析

上位下位知識を用いて頻度分析を行い,下位語の出現記事数が100件を超えている上位語を取り出した.その結果において出現記事数が多かったものと,少かったものの例をそれぞれ15件ずつを表4.2に示す.その取り出したものの中から重要項目になりうると思われるものを人手で選んだ.その結果「県」「時代」「地名」「元号」という4つの上位語を重要項目とした.その4つの上位語の下位語が出現した記事数をまとめたものを表4.3に示す.


表 4.2: 上位下位知識を用いた頻度分析の結果
上位語 下位語の出現記事数
2665
1912
1865
よう 1786
1706
1679
1655
1579
1573
1568
1557
1508
1477
1419
1374
... ...
平氏 104
104
ラー 104
藩庁 103
南朝 103
103
サー 103
理由 102
大和 102
政権 102
文禄 101
101
平安時代 100
自動車 100
100



表 4.3: 上位下位知識を用いた頻度分析の結果
上位語 下位語の出現記事数
1665
時代 1061
地名 301
元号 238


next up previous contents
Next: 実験 Up: 上位下位知識 Previous: 上位下位知識   目次
OkadaTakuma 2015-03-10