next up previous contents
次へ: おわりに 上へ: 考察 戻る: 先行研究と大きく差がついている原因   目次

先行研究の手法$ y$ について

先行研究の手法を用いた実験では, $ y$ =1,つまりルーツを特定したい人名の初出現年のみの著者名データを使用する方法が一番よい結果となった. これは,単に候補が少なくなるからであると考えられる. 結果を見てもわかるように, $ y$ を増やせば徐々に正解率が減っていく. 特に人名の場合は[*]節より他の人名と共起しやすいと数値が下がるため, 候補が増えれば増えるほど,正解とされるデータが2番目以降に出力されてしまう. やはり候補が増えれば増えるほど,正解とされるデータが2番目以降に出力されてしまいやすい. よって,候補数が少ない$ y$ =1が一番良い結果となった.



平成25年10月13日