next up previous contents
Next: 評価方法 Up: 単語の出現範囲の評価 Previous: 単語の出現範囲の評価   目次


実験条件

本実験では,小説を入力とした単語ネットワークを構築する.実験に用いる小説は,「怪人二十面相」,「こころ」,「吾輩は猫である」,「人間失格」,「銀河鉄道の夜」,「坊ちゃん」の6つである.表5.3に実験に用いた小説の文字数,文数,段落数を示す. なお,IDFの算出には毎日新聞2012年度(110,587記事)を用いる.



表 5.3: 小説の詳細なデータ
タイトル 文字数(文字) 文数(文) 段落数(個)
怪人二十面相 110,827 3,164 1,731
こころ 182,012 4,654 1,570
吾輩は猫である 366,158 7,487 2,234
人間失格 72,987 1,147 829
銀河鉄道の夜 41,464 1,120 487
坊ちゃん 103,221 2,451 514


next up previous contents
Next: 評価方法 Up: 単語の出現範囲の評価 Previous: 単語の出現範囲の評価   目次
s112054 2017-03-03