next up previous contents
次へ: 極性表現対集合の知識ベース化 上へ: 名詞句の評価極性算出 戻る: 極性表現対集合の取得   目次


コーパスの部分選択

SO-scoreで共起頻度を得るためのコーパスには2012年のブログコーパス1年分約4千万文を用いる.状況が夏の場合,夏に属するコーパスから共起頻度を求めることで,夏にブログ文中でよく出現する表現を集め易くなるという目的がある.状況を「夏」とすると7,8月分の約7百万文に,「冬」とすると12,1月分の約6百万文にそれぞれ限定できる.



平成26年3月7日