概念ネットワークの構築方法

大竹ら[1]が提案したネットワークの構築手法を述べる.
手順1
構築したいネットワークの主となる単語をテーマキーワードとして設定する.
手順2
キーワードとなる単語を含んだ記事群を抽出し,その記事群から形態素解析を用いて名詞のみを抽出する.その際,一文字,ひらがなのみ,数字のみの単語を除外する.
手順3
手順2で抽出された単語の出現頻度を調べ,上位100単語をノード候補とする.
手順4
得られたノード候補の中から,TF-IDF法を用い,値の大きな上位5単語をネットワークのノードとして選定する.TF-IDF法については2.3節にて述べる.
手順5
単語間の関係に重みを付与し,単語間の関連の強さに差をつける.
手順6
手順2から手順5を繰り返して概念ネットワークを拡張する.