そこで本研究では,2.2節で述べた従来のネットワーク構築法に,2.4節で述べたテーマ限定抽出法を導入したものに,同種の単語が出やすくなるようにした概念ネットワークの構築方法を提案する.以下にその手順を示す.
このうち,手順5で述べたTF-IDF値の計算方法として,TF-IDF合計値法とTF-IDF最大値法の2通りを提案する. TF-IDF合計値法は,クラスタ番号が同じ単語ごとにそれらの単語のTF-IDF値を足し,その合計値上位5位までのクラスタ番号に所属する単語をネットワークに表示させる方法である. TF-IDF最大値法は,クラスタ番号が同じ単語ごとにそれらの単語のTF-IDF値の最大の値を探し,その最大値上位5位までのクラスタ番号に所属する単語をネットワークに表示させる方法である.
この2つの手法の計算例をノード候補の単語とそのTF-IDF値が図3.3のとおりであると仮定して説明する.
このとき,TF-IDF合計値法の場合では,クラスタ番号2455が22.1,クラスタ番号2423が21.3,クラスタ番号2703が9.7となり,「ビデオカメラ」「レンズ」「スマートフォン」「パソコン」「市場」の順番に表示される. 一方,TF-IDF最大値法の場合では,クラスタ番号2455が13.5,クラスタ番号2423が17.7,クラスタ番号2703が9.7となり,「スマートフォン」「パソコン」「ビデオカメラ」「レンズ」「市場」の順番に表示される.