next up previous contents
次へ: カッパ係数による正例と負例の評価 上へ: 実験方法 戻る: 人手による感動を与える文の収集   目次


教師あり機械学習を利用した感動を与える文の収集

[*]節で得た, 正例と負例を学習データとした 教師あり機械学習を行う. ウェブコーパス[2]を教師あり機械学習で, 感動する文かいなかを判定することで, ウェブコーパス[2]から感動する文を収集する.

具体的な手順は以下のとおりである.

  1. [*]節の方法で得た 正例と負例を学習データとする.
  2. 学習データを用いて機械学習を行う.学習結果を利用して新しいウェブデータ1万文について正例,負例の判定を行う.正例とされた事例を人手でチェックして正しい正例と負例を新たに作成し学習データに追加する.
  3. [*]を10回繰り返す.

機械学習結果の出力においての正例と負例の判定基準は以下の通りである.

何らかの感想を得ることの出来た文は正例,客観的事実しか書かれていないものは負例とする.



eki takashi 平成24年3月13日