next up previous contents
次へ: 対話行為タグ 上へ: 分析対象 戻る: 分析対象   目次

使用するコーパスについて

事例の収集を行うためのコーパスは「MarukoCorpus」を用いる.これは,漫画『ちびまる子ちゃん』[1]の第一巻から第十巻 までを抽出したもので,先行研究[3]で『巻・話数・通番・頁・コマ・文ID・話者・台詞・形態素解析・対話行為タグ・表情 タグ・情緒タグ』等の情報が付与された対話コーパスである.
コーパスの規模は,ナレータを除いた台詞が29,537文存在し,情緒タグは20,891件,表情タグは17,676件となっている.
タグの種類についての簡単な説明を,次に示す.



Subsections

takumi shirayanagi 平成22年2月11日