次へ: 考察
上へ: 擬似的に作成したデータを用いた実験
戻る: 新聞に1,000文のブログ文書を混ぜた実験
目次
ブログに1,000文の新聞の文書を混ぜた実験
文書A,Bに4章で用いたブログと新聞の文書を利用した.
文書Xには,ブログの文書に1,000文の新聞の文書を混ぜたデータを利用した.
ブログでの頻度が0の対象語列を抽出すると,
混ぜた1,000文からは7文が,もとの9,000文からは328文が検出された.
これら335文を,新聞での頻度と混ぜた文かいなかで
分けると表5.2のようになる.
同様に検定を行うことによりとなり,
新聞(文書B)での頻度を利用することが有意に有効であることが確認された.
表:
ブログ頻度0で検出した結果を新聞頻度で分けたもの
|
平成25年10月13日