next up previous contents
Next: 実験 Up: 提案手法 Previous: 段落分けによる入力データの処理   目次

ノードへの段落情報の付与

単一文書を入力として単語ネットワークを構築した際に,ノードがどの段落に出現するかを提示できれば,入力データ内において,出現箇所の把握速度の向上が見込めると考えた.そこで,手法4.2で段落分けをした後,単語ネットワークに選出されるノードに段落番号を付与する.付与手順を以下に示す.
  1. 段落で分割された入力データに,それぞれ段落番号を割り当てる.
  2. 段落内にノードの単語を含む場合,ノードにその段落番号を付与する.
  3. 付与された段落番号を元に,平均値,標準偏差,出現範囲をノードに付与する.
  4. 段落番号の付与を行ったのち,単語ネットワークの階層内でノードに付与された平均値を降順で図の左から並べる.
なお,ノードに付与する情報が多すぎることによって,可視性を損なう恐れがあるため,入力データの文章量により,適宜付与する情報を選択する.

文章量が少ない例として「新聞記事」を入力とした場合の単語ネットワークを図4.1,文章量が多い場合の例として「小説」を入力とした場合の単語ネットワークを図4.2に示す.なお,「新聞記事」の単語ネットワークに付与する情報は段落番号,平均値,標準偏差とした場合,「小説」の単語ネットワークに付与する情報は平均値とした場合である.

図 4.1: 「マナー」に関する新聞記事のネットワーク
12#12

図 4.2: 小説「怪人二十面相」のネットワーク
13#13



s112054 2017-03-03