Next: 実験
Up: 提案手法
Previous: 段落分けによる入力データの処理
目次
単一文書を入力として単語ネットワークを構築した際に,ノードがどの段落に出現するかを提示できれば,入力データ内において,出現箇所の把握速度の向上が見込めると考えた.そこで,手法4.2で段落分けをした後,単語ネットワークに選出されるノードに段落番号を付与する.付与手順を以下に示す.
- 段落で分割された入力データに,それぞれ段落番号を割り当てる.
- 段落内にノードの単語を含む場合,ノードにその段落番号を付与する.
- 付与された段落番号を元に,平均値,標準偏差,出現範囲をノードに付与する.
- 段落番号の付与を行ったのち,単語ネットワークの階層内でノードに付与された平均値を降順で図の左から並べる.
なお,ノードに付与する情報が多すぎることによって,可視性を損なう恐れがあるため,入力データの文章量により,適宜付与する情報を選択する.
文章量が少ない例として「新聞記事」を入力とした場合の単語ネットワークを図4.1,文章量が多い場合の例として「小説」を入力とした場合の単語ネットワークを図4.2に示す.なお,「新聞記事」の単語ネットワークに付与する情報は段落番号,平均値,標準偏差とした場合,「小説」の単語ネットワークに付与する情報は平均値とした場合である.
図 4.1:
「マナー」に関する新聞記事のネットワーク
12#12
|
図 4.2:
小説「怪人二十面相」のネットワーク
13#13
|
s112054
2017-03-03