next up previous contents
次へ: Turneyらの評価極性の分類 上へ: 関連研究 戻る: 情緒属性付き結合価パターン辞書を用いた情緒推定   目次

Webから獲得する感情生起要因コーパスと感情極性の推定

文献[2]によれば,人が感情を生起す る要因をWebコーパスから自動獲得した.そこでは,KawaharaらのWebコーパス [5](5億文)を使用した. これにより, 《嬉しい》,《楽しい》,《安心》, 《恐い》,《悲しい》,《残念》,《嫌》,《寂しい》,《心配》,《腹立たし い》,および,〈neutral〉(ユーザ発話が感情的な意味を持たないことを表す) の11種類の感情を推定した.

PositiveとNegativeの事態を抽出するためには, 寺村の定義[6]を参考として,次の基準を用いた.

$X$ = 感情主,$Y$ = 対象,$Z$ = 当該語のとき,「$X$$Y$$Z$」 「$X$$Y$$Z$」「$X$$Y$$Z$」のいずれかが表現できれば,$Z$は感情表現 である.

この定義に従い, 小林らの直接表現辞書[7]から349語の感情表現を得ることができた.表 2.1に抽出した感情ごとの感情表現の数と例を示す.

そして,図2.4に示す言語パターンを用いることでWebコーパスから自 動的に感情生起要因(本論の情緒生起要因と同等の意味をもつ.この文献では感 情生起に関する用 例文を示す.)を獲得した.接続表現には8種類(ので,から,ため,て, のは,のが,ことは,ことは,ことが)を用いた.たとえば,「突然雨が降り出 した のは がっかりだ」という文からは,〈がっかり〉が生起する 要因として{突然雨が降り出した}を獲得する.



表 2.1: 感情生起要因コーパスの規模と例
    感情表現(349語)
   
  嬉しい 90 嬉しい,狂喜,喜ぶ,歓ぶ
Positive 楽しい 7 楽しい,楽しむ,楽しめる
  安心 5 安心,ほっと
  恐い 22 恐い,怖い,恐ろしい
  悲しい 21 悲しい,哀しい,悲しむ
  残念 15 がっかり,がっくり
Negative 109 嫌,嫌がる,嫌い
  寂しい 15 寂しい,淋しい,わびしい
  心配 17 不安,心配,気がかり
  腹立たしい 48 腹立たしい,腹立つ,立腹





図 2.4: 感情生起要因を獲得するための言語パターン
\includegraphics[scale=0.5, clip]{nodebun2.eps}

感情生起要因を用いた感情推定の手法として,単語,単語自体の感情極性,係 り受けの情報を特徴量として文の感情極性(本論では評価極性とも呼ぶ)を推定した.図2.5に「福 祉の費用の負担が増えてしまう」という文に対して,単語の感情極性つきで記述 した例を示す.「福祉」はPositive,「費用,負担」はNegativeの感情極性を持 つとする.図2.5のラティスに対して,例えば3-gramの列を展開すると, 「福祉の費用,Pos.の費用,福祉のNeg.,Pos.のNeg.,の費用の,のNeg. の,…」などが得られる.これらを素性としてSVM(学習にはTinySVM: http://chasen.org/~taku/software/TinySVM/)で学習して感情極性推定モデ ルを構築する.


図 2.5: 感情極性つきのラティスの例
\includegraphics[scale=0.5, clip]{rathis.eps}


next up previous contents
次へ: Turneyらの評価極性の分類 上へ: 関連研究 戻る: 情緒属性付き結合価パターン辞書を用いた情緒推定   目次
平成24年3月20日