next up previous contents
次へ: 対話行為タグ 上へ: 本研究で使用するリソース 戻る: 本研究で使用するリソース   目次

使用するコーパス

機械学習には,教師あり機械学習SVMを用いる.そのため,本研究では,対話行為および情緒タグ付きコーパスを使用する [2],[3].コーパスの対話文は,漫画ちびまる子ちゃんの1〜10巻から収録する.対話行為タグ,情緒タグの種類と説明は 後に記載する.漫画の1コマ内で同一人物の全ての発話文を1つの被付与単位(コマ人単位と呼ぶことにする)とし,1つ以上の情緒タグが付与されている. また,前コマ人と現コマ人との発話文のペアをコマ人ペアと呼ぶことにする.

コーパスの規模は,26,527文,17,078コマ人である.対話行為タグ数は26,527個,情緒タグ数は21,998個である.



Subsections

平成25年1月15日