next up previous contents
次へ: 謝辞 上へ: sotu4 戻る: 先行研究の手法 について   目次

おわりに

本論文では研究情報の派生概念(例えば,人名では「池原悟(先輩)→村上仁一(後輩)」のような先輩後輩関係の対, 分野名では「統計(ルーツ)→統計的機械翻訳(派生概念)」のような派性関係の対)を自動的に抽出する新しい方法を提案した. その方法は,以下の特徴に基づいている.

具体的には,早い時期に人名Aと共起している人名の重みを高くしつつ, 人名Aと共起している回数分その重みを加算してその合計の値が最も大きい人名を人名Aのルーツとする方法をとった. この提案手法は,先に述べた2つの特徴をどちらも考慮できている方法となっている.

付与する重み$ a$ を0〜1で0.1刻みに変化させ実験を行ったところ, 提案手法は最高で人名で0.64〜0.66,分野名で0.65の正解率を出した.

また,重み付けをしないものと同様のものとなる$ a$ =0,または$ a$ =1の場合を考える. $ a$ =0の場合は初出現時で共起したもののみを考慮する方法であり, また$ a$ =1の場合は出現回数は考慮するが,出現時期は考慮していない方法である. この2つの場合は,人名で0.45〜0.50,分野名で0.60の正解率であり, 重み付けをした提案手法の方が正解率が高いことがわかり,提案手法の有効性を確認できた.

さらに,相互情報量に基づく先行研究との比較実験を行った. 先行研究の手法での正解率は最大で人名で0.25,分野名で0.61の正解率であり, 相互情報量を用いる方法よりも提案手法の性能が高いことを確認した.



平成25年10月13日