符号検定による知見獲得

本研究では,統計的検定に符号検定を用いる.符号検定では,A,Bを含む文中からA,Bと共起する素性が全データの出現率より偏って多くどちらかの分類先に出現しているかを二項定理に基づく片側検定により求め,有意確率p値を求める.p値が低い素性ほど有用な素性であるので,値の小さいp値を持つ素性を分析することで単語対に関わる知見獲得を行う. 符号検定の説明を3.6節に示す.