この例の「今村賢治」の正解は「柏岡秀紀」である.
=0.8の場合は正解を出力しているが,
=0.9の場合は「隅田英一郎」が一番最初に出力されており,
不正解となっている.
この原因は,出現年を見ると早くに共起しているのは「柏岡秀紀」であるが,
出現回数を見ると「隅田英一郎」の方が多いためである.
これにより,重み
が1に近づくほど,出現回数の方を重視してしまう傾向にあることが原因である.
同じことが0付近の重み
にも言える.
重み
が0に近づくほど,出現回数よりも出現年が早いものの方を重視してしまう傾向にあるということが言える.
この2つ事柄と実験の結果より,やはり出現年と出現回数のどちらも考慮した方が有効であることがわかる.