next up previous contents
次へ: 「に」「にも」の分析 上へ: 実験 戻る: 実験結果   目次

素性分析

「も」の使い分けにおいて, それぞれどのような素性が役に立つのかを明らかにするために, 素性の分析を行う. 素性分析には, 4.1節で 使用した学習データの各データを同数にしないものから得られるものを使用する.

素性が全データでの出現率より偏って多くどちらかの分類先に出現しているかを, 二項検定に基づく片側検定により求め, 有意確率p値を求める. 有意水準は「に」「にも」, 「が」「がも」の使い分け問題では5%, 「を」「をも」では10%とする. 得られた有用な素性の数は表4.9, また得られた有用な素性の例を表4.10に示す.


表: 有用な素性の数
使い分け問題 分類先 獲得ルール数
「に」「にも」 「に」 60
  「にも」 52
「が」「がも」 「が」 54
  「がも」 21
「を」「をも」 「を」 18
  「をも」 12


表: 得られた有用な素性の例
使い分け問題 分類先 素性 p値
に/にも 「に」 直後単語:対する 0.0149
  「にも」 共単:接続詞:また 0.0027
が/がも 「が」 連体単:こと 0.0001
  「がも」 直後単語:ある 0.0007
を/をも 「を」 格に存在 0.0016
  「をも」 用形列:ない 0.0104



Subsections

平成26年4月2日