[6]のコーパスは 漫画『ちびまる子ちゃん』[1]の 登場人物の発話に対し,発話の際の表情を表す表情タグと, その際の発話内容,表情,および文脈情報から推定される情緒を表す 情緒タグを付与した,文数約3万文のコーパスである.
このコーパスに収録されている発話文から機械的に抽出された 文末表現が3,652件存在する. 文末表現には, 《好ましい》,《期待》,《喜び》,《悲しみ》,《恐れ》, 《怒り》,《嫌だ》,《驚き》,《情緒なし》 の9種類の情緒について,0から1までの数値付きで記述されている. この数値は,[6]のコーパスにおける 情緒と文末表現の共起確率を表しており, 情緒の強さを表す数値ではない. この数値を情緒成分と呼ぶこととする. 文末表現の一部を表1に示す.
好ましい | 期待 | 喜び | 悲しみ | 恐れ | 怒り | 嫌だ | 驚き | なし | 文末表現 |
・ | |||||||||
・ | |||||||||
0.25 | 0.25 | 0.25 | 0 | 0.25 | 0 | 0 | 0 | 0 | ますか。@ |
0.25 | 0.5 | 0.25 | 0 | 0 | 0 | 0 | 0 | 0 | てみるよ。@ |
0 | 0 | 0 | 0 | 0.2 | 0 | 0.4 | 0.4 | 0 | な〜。@ |
0 | 0 | 0 | 0 | 0.2 | 0 | 0.6 | 0.2 | 0 | …やだな…。@ |
0 | 0 | 0 | 0 | 0.4 | 0 | 0.4 | 0.2 | 0 | てるんだろ…。@ |
0 | 0 | 0 | 0 | 0.4 | 0.4 | 0.2 | 0 | 0 | @お父さんっ。@ |
・ | |||||||||
・ |