next up previous contents
次へ: データ形式の参考 上へ: 研究の背景 戻る: 文末表現の処理に関する先行研究   目次


情緒表現性のある文末表現

[6]のコーパスは 漫画『ちびまる子ちゃん』[1]の 登場人物の発話に対し,発話の際の表情を表す表情タグと, その際の発話内容,表情,および文脈情報から推定される情緒を表す 情緒タグを付与した,文数約3万文のコーパスである.

このコーパスに収録されている発話文から機械的に抽出された 文末表現が3,652件存在する. 文末表現には, 《好ましい》,《期待》,《喜び》,《悲しみ》,《恐れ》, 《怒り》,《嫌だ》,《驚き》,《情緒なし》 の9種類の情緒について,0から1までの数値付きで記述されている. この数値は,[6]のコーパスにおける 情緒と文末表現の共起確率を表しており, 情緒の強さを表す数値ではない. この数値を情緒成分と呼ぶこととする. 文末表現の一部を表1に示す.




表 1: 情緒表現性のある文末表現(一部)
好ましい 期待 喜び 悲しみ 恐れ 怒り 嫌だ 驚き なし 文末表現
0.25 0.25 0.25 0 0.25 0 0 0 0 ますか。@
0.25 0.5 0.25 0 0 0 0 0 0 てみるよ。@
0 0 0 0 0.2 0 0.4 0.4 0 な〜。@
0 0 0 0 0.2 0 0.6 0.2 0 …やだな…。@
0 0 0 0 0.4 0 0.4 0.2 0 てるんだろ…。@
0 0 0 0 0.4 0.4 0.2 0 0 @お父さんっ。@


next up previous contents
次へ: データ形式の参考 上へ: 研究の背景 戻る: 文末表現の処理に関する先行研究   目次
平成19年2月16日