列の重要度の計算方法(岡崎)

列の重要度を計算するときは列の情報のカバー率と情報の密集度を用いて計算する.

列の情報のカバー率($cover_i$)は列の空ではないセルの割合である.数式を式2.5に示す.

$\displaystyle cover_i = \frac {列iの空ではないセルの数}{列iのセルの総数}$ (5)

列の情報の密集度($density_i$)は列iにあるデータの間の最小類似度である.数式で示す. $\vert C_i\vert$は列iにあるデータの数である.

$\displaystyle density_{i}=min(cos(W_{ij},W_{ih}))$ (6)


$\displaystyle j,h=1,......,\vert C_{i}\vert$      

列iの重要度( $Important_i$)はこの二つの値の正規化値の掛け算の結果である.

$\displaystyle Important_i = norm(density_i) * norm(cover_i)$ (7)