next up previous contents
次へ: 考察 上へ: 擬似的に作成したデータを用いた実験 戻る: 新聞に1,000文のブログ文書を混ぜた実験   目次


ブログに1,000文の新聞の文書を混ぜた実験

文書A,Bに4章で用いたブログと新聞の文書を利用した. 文書Xには,ブログの文書に1,000文の新聞の文書を混ぜたデータを利用した. ブログでの頻度が0の対象語列を抽出すると, 混ぜた1,000文からは7文が,もとの9,000文からは328文が検出された. これら335文を,新聞での頻度と混ぜた文かいなかで 分けると表5.2のようになる. 同様に検定を行うことによりとなり, 新聞(文書B)での頻度を利用することが有意に有効であることが確認された.


表: ブログ頻度0で検出した結果を新聞頻度で分けたもの




平成25年10月13日