PositiveとNegativeの事態を抽出するためには, 寺村の定義[6]を参考として,次の基準を用いた.
= 感情主, = 対象, = 当該語のとき,「はを」 「はに」「はが」のいずれかが表現できれば,は感情表現 である.
この定義に従い, 小林らの直接表現辞書[7]から349語の感情表現を得ることができた.表 2.1に抽出した感情ごとの感情表現の数と例を示す.
そして,図2.4に示す言語パターンを用いることでWebコーパスから自 動的に感情生起要因(本論の情緒生起要因と同等の意味をもつ.この文献では感 情生起に関する用 例文を示す.)を獲得した.接続表現には8種類(ので,から,ため,て, のは,のが,ことは,ことは,ことが)を用いた.たとえば,「突然雨が降り出 した のは がっかりだ」という文からは,〈がっかり〉が生起する 要因として{突然雨が降り出した}を獲得する.
感情表現(349語) | |||
嬉しい | 90 | 嬉しい,狂喜,喜ぶ,歓ぶ | |
Positive | 楽しい | 7 | 楽しい,楽しむ,楽しめる |
安心 | 5 | 安心,ほっと | |
恐い | 22 | 恐い,怖い,恐ろしい | |
悲しい | 21 | 悲しい,哀しい,悲しむ | |
残念 | 15 | がっかり,がっくり | |
Negative | 嫌 | 109 | 嫌,嫌がる,嫌い |
寂しい | 15 | 寂しい,淋しい,わびしい | |
心配 | 17 | 不安,心配,気がかり | |
腹立たしい | 48 | 腹立たしい,腹立つ,立腹 |
感情生起要因を用いた感情推定の手法として,単語,単語自体の感情極性,係 り受けの情報を特徴量として文の感情極性(本論では評価極性とも呼ぶ)を推定した.図2.5に「福 祉の費用の負担が増えてしまう」という文に対して,単語の感情極性つきで記述 した例を示す.「福祉」はPositive,「費用,負担」はNegativeの感情極性を持 つとする.図2.5のラティスに対して,例えば3-gramの列を展開すると, 「福祉の費用,Pos.の費用,福祉のNeg.,Pos.のNeg.,の費用の,のNeg. の,…」などが得られる.これらを素性としてSVM(学習にはTinySVM: http://chasen.org/~taku/software/TinySVM/)で学習して感情極性推定モデ ルを構築する.