next up previous contents
次へ: 先行研究の手法を用いた実験結果 上へ: 先行研究との比較実験 戻る: 先行研究の手法を用いた分野名の変遷情報の推定方法   目次

提案手法と先行研究の手法との違い

川中らの先行研究は,上記の通り相互情報量に基づく方法で共起性の高いものを取ることが本研究と異なっている. 川中らの手法では,共起度の指標としてAEMI(Augmented Expected Mutual Information)を用いている. AEMIは確率を考慮した精細な共起度を測るための指標であり, 次のように示される.


$\displaystyle AEMI(a,b)$ $\displaystyle =$ $\displaystyle MI(a,b) + MI(\overline{a},\overline{b}) - MI(a,\overline{b}) - MI(\overline{a},b)$ (6.1)
$\displaystyle MI(a,b)$ $\displaystyle =$ $\displaystyle P(a,b)log\frac{P(a,b)}{P(a)P(b)}$ (6.2)

この場合,$ P(a)$ は人名Aが出現する確率であり,$ P(a,b)$ は人名Aと人名Bが共起する確率である. 更に, $ P(\overline{a})$ は人名Aが出現しない確率を表す. MIは共起率を評価するための一つの指標であり,AEMIはMIを組み合わせることで, スケールを考慮した確率的な共起度の高さを測ることができる. この式に従い,共起度を求めて一番大きいものをその人名(または分野名)のルーツとする.



平成25年10月13日