next up previous contents
次へ: 手順4:判断条件の真偽判定 上へ: 各手順の説明 戻る: 手順2:名詞句の認識   目次


手順3: $SO\mathchar \lq -score$の算出と名詞句の分解

手順2で得た名詞句の評価極性を算出する. $SO\mathchar \lq -score$の算出の際に必要となるのは,以下の4項目である.
(1)
コーパス内での``良い''の出現文数(好評文)
(2)
コーパス内での``悪い''の出現文数(不評文)
(3)
コーパス内で``語句$x$''と``良い''が同時に出現する文数
(4)
コーパス内で``語句$x$''と``悪い''が同時に出現する文数
ここで(1)に関しては,コーパスから``良い''を含む文を抽出した好評文の文数,(3)に関しては(1)から``語句$x$''を含む文を抽出した数をカウントすれば良い.(2)と(4)に関しても同様に行う.これらに0.01を足し,(3.4)式に代入することで $SO\mathchar \lq -score$の算出を行う.手順2で得た名詞句を,まずは分解なしで $SO\mathchar \lq -score$算出式に代入する.評価極性が得られた場合はそれを採用し,手順4に移る.もし,共起頻度不足で評価極性が得られなかった場合は,表3.1のように名詞句を分解して $SO\mathchar \lq -score$を算出し,総和をとることで評価極性を算出する.表の全ての分解パターンで評価極性が算出出来なかった場合は,その名詞句には評価極性を付与しない.



Sho Takemoto 平成24年3月13日