next up previous contents
次へ: の算出に用いる好評表現と不評表現 上へ: 評価極性の算出 戻る: 評価極性の算出   目次

$SO\mathchar \lq -score$の算出式

名詞句に評価極性を付与する手法としてTurneyらの手法を用いる.Turneyらは,次式を用い,コーパスから語句$x$の評価極性を算出した[7]. $SO\mathchar \lq -score$の算出式を(3.1)式に,相互情報量$PMI$の算出式を(3.2)式に示す.ここで,$p(a,b)$はコーパス内において語句$a$と語句$b$が同一文で共起する確率を,$p(a)$は語句$a$を含む文がコーパス内に出現する確率をそれぞれ表す.

また,(3.1)式と(3.2)式から変形して,コーパス中での出現文数$hits$で表した式を(3.3)式に示す.$hits$に複数の代入がされている場合はそれらが同時に出現した文数を表す.

$\displaystyle SO\mathchar\lq -score(x) = PMI(x,\lq\lq 好評表現'') - PMI(x,\lq\lq 不評表現'')$     (3.1)


$\displaystyle PMI(a,b) = \log_{2} \frac{p(a,b)}{p(a)p(b)}$     (3.2)


$\displaystyle SO\mathchar\lq -score(x) = \log_{2} \frac{hits(\lq\lq 不評表現'')hits(x,\lq\lq 好評表現'')}{hits(\lq\lq 好評表現'')hits(x,\lq\lq 不評表現'')}$     (3.3)

$SO\mathchar \lq -score$を算出する際にTurneyらは``好評表現''に``excellent'',``不評表現''に``poor''を用いている.また,$hits$の値が0の時,$log$が計算できないため,$hits$には最初から0.01を足している.



Sho Takemoto 平成24年3月13日