next up previous
次へ: 実験の方法 上へ: 実験 戻る: 使用する文書

評価のパラメータ

実験結果は,以下の4つのパラメータを用いて評価する.

  1. $ \sim $ :文書類似度


    \begin{displaymath}sim (D_i,D_j) = V_i \cdot V_j \end{displaymath} (9)

    (但し,$V_i \cdot V_j $ は,それぞれ,文書$ D_i,D_j$の特性ベクトル)

  2. $R$ : 再現率(recall factor)


    \begin{displaymath}
R = {抽出された正解文書数 \over データベース中の正解文書数}
\end{displaymath} (10)

  3. $P$ : 適合率(precision factor)


    \begin{displaymath}
P = {抽出された正解文書数 \over 抽出された文書数 }
\end{displaymath} (11)

  4. $F$ : 検索精度(f-parameter)


    \begin{displaymath}
F = { { (b ^ 2 + 1) \cdot P \cdot R} \over { b^2 \cdot P + R}}
\end{displaymath} (12)

但し,式12のパラメータ$b$は,$P$に対する$R$の相対的な重みを 示す.実験では,両者を対等と考え,$b=1$とする.



平成15年4月18日