条件付き確率を用いる方法を説明する. を単語aを含んだ記事群, をノード候補の単語を含んだ記事群とし, は単語aを含んだ記事数, は単語aとノード候補の単語が同じ記事内で共起した記事数であるとし条件付き確率を式3.1で表す.
この値が大きいノード候補の単語をモデルのノードとして用いる.
TF-IDFを用いる方法を説明する. は抽出された対象テキスト内でのノード候補の単語の出現回数, は新聞データ内でのノード候補の単語の出現記事数とし, は新聞データの総記事数としTF-IDFを式3.2で表す.
この値が大きいノード候補の単語をモデルのノードとして用いる. 上記の方法で選定した5単語を単語aのノードから繋がるノードnとする.