次へ: 手順4:判断条件の真偽判定
上へ: 各手順の説明
戻る: 手順2:名詞句の認識
目次
手順3:
の算出と名詞句の分解
手順2で得た名詞句の評価極性を算出する.
の算出の際に必要となるのは,以下の4項目である.
- (1)
- コーパス内での``良い''の出現文数(好評文)
- (2)
- コーパス内での``悪い''の出現文数(不評文)
- (3)
- コーパス内で``語句''と``良い''が同時に出現する文数
- (4)
- コーパス内で``語句''と``悪い''が同時に出現する文数
ここで(1)に関しては,コーパスから``良い''を含む文を抽出した好評文の文数,(3)に関しては(1)から``語句''を含む文を抽出した数をカウントすれば良い.(2)と(4)に関しても同様に行う.これらに0.01を足し,(3.4)式に代入することで
の算出を行う.手順2で得た名詞句を,まずは分解なしで
算出式に代入する.評価極性が得られた場合はそれを採用し,手順4に移る.もし,共起頻度不足で評価極性が得られなかった場合は,表3.1のように名詞句を分解して
を算出し,総和をとることで評価極性を算出する.表の全ての分解パターンで評価極性が算出出来なかった場合は,その名詞句には評価極性を付与しない.
Sho Takemoto
平成24年3月13日