next up previous contents
次へ: 名詞句の評価極性算出 上へ: 評価極性の算出 戻る: の算出に用いる好評表現と不評表現   目次


$SO\mathchar \lq -score$の算出に用いるコーパス

$SO\mathchar \lq -score$の算出には2008年1月1日〜2010年12月31日までの2年分のブログ文コーパスを用いる.そのうち,文の極性の反転として扱われる接続表現[8]を含む文は予め省いておく.
表: 極性が反転する接続表現
におうじて かと思ったら けど にしても
に応じて からこそ けれど にしろ
につれて からって たって にせよ
に連れて からといって たところが にもかかわらず
にともなって からと言って たところで のに
に伴って からとて だけにかえって のにたいして
ほど かわりに つつも のに対して
代わりに としても はんめん
るにしたがって 代りに とはいうものの 反面
るに従って たが とは言うものの ようとも
いっぽう だが とはいえ よりむしろ
一方 するが とは言え より寧ろ
かというと たいが どころか よりもむしろ
かと言うと ているが ながら よりも寧ろ
かとおもえば あるが ながらに  
かと思えば ですが ながらも  
かとおもったら ますが にしては  

3.1に含まれる語句を除いたコーパスより好評表現,不評表現を含む文を抽出する.

その結果,好評表現``良い''を含む文を2,350,086文,不評表現``悪い''を含む文を854,779文得た.``良い''で抽出した文を好評文,``悪い''で抽出した文を不評文とする. $SO\mathchar \lq -score$の算出に好評文と不評文を用いる際には,好評文の数を854,779文に減らし,不評文と文の数を揃えた.


next up previous contents
次へ: 名詞句の評価極性算出 上へ: 評価極性の算出 戻る: の算出に用いる好評表現と不評表現   目次
Sho Takemoto 平成24年3月13日