next up previous contents
次へ: カッパ係数による正例と負例の評価 上へ: 感動を与える文の収集 戻る: 人手による感動を与える文の収集   目次


教師あり機械学習による感動を与える文の収集

[*]節の方法で得た 正例1,018個,負例406個を学習データとし,[*]節で述べた方法を用いて感動を与える文の収集を行う.

何らかの感想を得ることのできた文は正例,客観的事実しか書かれていないものは負例とする.正例と負例の例を以下に示す.

  1. 正例の例
    ・大学に合格した
    ・明日は映画の公開日だ
    ・私にはまだ父と母の親であるおじいちゃんとおばあちゃんが四人とも元気に過しています
  2. 負例の例
    ・大学がある
    ・プラスチックは燃えないゴミだ
    ・図を挿入することができる

機械学習の判定を10回繰り返し,得られた正例と負例の個数を表[*]に示す.


表: 追加された正例と負例の個数
  正例 負例
1回目 111 2108
2回目 30 164
3回目 15 137
4回目 8 119
5回目 8 111
6回目 14 90
7回目 19 96
8回目 28 57
9回目 23 65
10回目 19 59
合計 275 3006

人手で収集したものとあわせて,正例が1,293個,負例が3,412個となった.

上記では10回しか繰り返さなかったが,さらに繰り返すことでより多くの正例と負例を収集できる.



eki takashi 平成24年3月13日