next up previous contents
次へ: 評価極性算出までの流れ 上へ: 名詞句の評価極性算出 戻る: 名詞句の評価極性算出   目次

itSO-score 算出式の拡張

複数の単語に対する評価極性を算出するため,SO-score算出式を,式(3.1)の通りに拡張する.


$\displaystyle \mbox{{\it SO-score}}(T) = \mbox{\it {PMI}}(T, P) - \mbox{\it {PMI}}(T, N)$     (3.1)

ここで,変数$T$は評価極性を算出される表現の集合を,変数$P$は好評表現集合を,変数$N$は不評表現集合をそれぞれ表す.例えば,表現集合$T$は,「$A$$B$」型名詞句や,「形容詞$A$名詞$B$」型名詞句の場合は,$T = \{A,B\}$となる.好評表現集合$P$,不評表現集合$N$は,名詞の種類,判断条件,状況の3つで極性表現対知識ベースを参照して求める(3.3節).次に,2つの表現集合$X$, $Y$の間のPMIを式(3.2)の通りにして求める.


$\displaystyle \mbox{\it {PMI}}(X,Y) = \log_{2} \frac{p(X,Y)}{p(X)p(Y)}$     (3.2)



$\displaystyle p(X) = \frac{1}{C} \vert \bigcup_{x \in X} s(x) \vert$     (3.3)



$\displaystyle p(X,Y) = \frac{1}{C} \vert \bigcup_{x \in X, y \in Y} s(x, y) \vert$     (3.4)

ここで,関数 $s(x)$ は単語 $x$ を含む文の集合を返す関数, 関数 $s(x, y)$ は単語 $x$ および $y$ の両方を含む文の集合を返す関数であり,これらはコーパス(3.2.5節)から求める.変数$C$は算出に用いるコーパスの総文数である.



平成26年3月7日