next up previous contents
次へ: 出力例 上へ: 提案手法 戻る: 分野名の変遷情報の推定方法   目次


重み付け手法

本研究では最初の時期に共起するものほど重要と考え大きな重みを付け, また共起回数が多いほど重要とも考え出現した回数だけ重みを加算するという手法を取る. [手順3]で人名Aを含む論文の著者名データ10件の, 年毎に出てきた著者名データに含まれる人名すべてに重み$ a^{j_k}$ ($ j_k$ = k番目の論文の出現年-初出現年,ただし$ j_k=0$ の場合は重み1)をつける. その重みを人名ごとに加算し,重みが一番大きいものをその人名の先輩と判断する.

例を図[*]に示す.

図: 重み付けの例
\includegraphics[width=9cm,clip]{omomi_fig1.eps}

[*]のようなデータがあるとする. このように人名Aを調べたい人名とし,初出現年が1990年の場合,

1990年に出てきた論文の著者名データに出現する人名すべてに重み1,

1991年に出てきた論文の著者名データに出現する人名すべてに重み1×$ a$

1992年に出てきた論文の著者名データに出現する人名すべてに重み1×$ a$ ×$ a$

...

を与える. このように年毎に重みを付与する. この場合では1990年に出てきた論文の著者名データに出現する人名が一番重要と考え,一番大きい重みをつける.

例えば,重みaを0.5とした場合を考える. この場合, 1990年に人名Aと共起した人名B,Cに重み1, 1991年に人名Aと共起した人名B,Dに重み0.5, 1992年に人名Aと共起した人名C,E,Fに重み0.5×0.5,すなわち重み0.25を与える. ここで,重みを人名ごとに加算する. 図3.2より,人名Bの1.5が一番重みが大きい. よって,人名Bを人名Aのルーツと考えることができる.





$\displaystyle score(x) = \displaystyle\sum_{k=1}^{10} f_k \cdot g_k(x)$     (3.1)



$\displaystyle f_k = \left\{ \begin{array}{ll}
1 & (j_k = 0) \\
a^{j_k} & (j_k > 0) \\
\end{array} \right.$     (3.2)

ただし$ g_k(x)$ は,$ k$ 番目の論文が,$ x$ という人名を持つ場合1,そうでない場合0を取る.

分野名の変遷推定でも同様の方法を取る.

なお,$ a$ の値は0から1に変化させ,違いを見る.



平成25年10月13日