next up previous contents
次へ: 先行研究と大きく差がついている原因 上へ: 考察 戻る: 性能を改善するための方策   目次

$ a$ の値(0.1〜0.9)によって正解率が異なる原因

人名の実験では,$ a$ =0.1〜0.9の間で正解率が異なる場合がある. 例を図[*]に示し,説明する.

図: 「今村賢治」の出力例
\begin{figure}\begin{center}
\begin{itembox}[c]{出力}
\begin{verbatim}人名:今...
...
-----
  ・
  ・
  ・\end{verbatim}
\end{itembox}
\end{center}\end{figure}

この例の「今村賢治」の正解は「柏岡秀紀」である. $ a$ =0.8の場合は正解を出力しているが,$ a$ =0.9の場合は「隅田英一郎」が一番最初に出力されており, 不正解となっている. この原因は,出現年を見ると早くに共起しているのは「柏岡秀紀」であるが, 出現回数を見ると「隅田英一郎」の方が多いためである. これにより,重み$ a$ が1に近づくほど,出現回数の方を重視してしまう傾向にあることが原因である.

同じことが0付近の重み$ a$ にも言える. 重み$ a$ が0に近づくほど,出現回数よりも出現年が早いものの方を重視してしまう傾向にあるということが言える.

この2つ事柄と実験の結果より,やはり出現年と出現回数のどちらも考慮した方が有効であることがわかる.



平成25年10月13日