次へ: 対話行為タグ
上へ: 分析対象
戻る: 分析対象
目次
事例の収集を行うためのコーパスは「MarukoCorpus」を用いる.これは,漫画『ちびまる子ちゃん』[1]の第一巻から第十巻
までを抽出したもので,先行研究[3]で『巻・話数・通番・頁・コマ・文ID・話者・台詞・形態素解析・対話行為タグ・表情
タグ・情緒タグ』等の情報が付与された対話コーパスである.
コーパスの規模は,ナレータを除いた台詞が29,537文存在し,情緒タグは20,891件,表情タグは17,676件となっている.
タグの種類についての簡単な説明を,次に示す.
Subsections
takumi shirayanagi
平成22年2月11日