next up previous contents
次へ: 提案手法 上へ: 共起頻度を用いた評価極性の算出 戻る: itSO-scoreの算出式   目次

itSO-scoreの算出に用いる好評表現と不評表現

本研究では,SO-scoreの値が正の場合,$x$は「好評極性」であり,負の場合,$x$は「不評極性」であると解釈する.SO-scoreが0の場合は「極性なし」とする.コーパスに出現した共起頻度が4未満の語句については,共起頻度不足として扱い,評価極性を付与しない.日本語のコーパスで$x$SO-scoreを求める場合,(2.1)式の``好評表現'',``不評表現''には``excellent'',``poor''の代わりに``良い'',``悪い''がよく用いられる.これらを(2.3)式に代入した式を(2.4)式に示す.また,$hits$には,Turneyらと同様に最初から0.01を足す.
$\displaystyle SO\mathchar\lq -score(x) = \log_{2} \frac{hits(\lq\lq 悪い'')hits(x,\lq\lq 良い'')}{hits(\lq\lq 良い'')hits(x,\lq\lq 悪い'')}$     (2.4)



平成26年3月7日