next up previous contents
次へ: 新聞に1,000文のブログ文書を混ぜた実験 上へ: 擬似的に作成したデータを用いた実験 戻る: 擬似的に作成したデータを用いた実験   目次


入れ替えた文の検出

別の新聞記事とブログ記事として,毎日新聞1992年とココログの2009年10月の記事からそれぞれ10,000文を用意し,ランダムに1,000文を入れ替え, 入れ替えた文をどのくらい正しく3章の提案手法で検出できるかを調べる. 提案手法の手順は3章の通りであるが,4章とは違い, 検出を行うデータが頻度を算出するデータと異なっている点に注意する (3章のとおり検出には文書Aの頻度0を利用する).



平成25年10月13日