next up previous contents
次へ: 辞書の作成 上へ: タグ付きテキスト対話コーパスの構築 戻る: タグ付与の様子   目次

タグ付与の結果

正解タグは,26,603個であった. 対話行為タグの分布を表4,表5に示す.タグは, 以下のような組み合わせにより形成されるので111 通りを想定していた. しかし,実際に使用されたのは100通りであった.


1.3
表 4: 対話行為タグの分布(補助属性を考慮した場合)
生理 欲求 情緒 プラン 属性 その他 空白
質問 0 1 - 0 0 - 0 1 - 6 113 - 0 10 - 0 55 - -
0 13 - 0 9 - 2 10 - 9 340 - 1 70 - 5 503 - -
確認 0 13 2 1 2 2 1 12 6 8 141 43 0 26 8 4 36 15 -
5 48 12 8 23 6 4 57 19 55 349 19 27 300 75 38 364 150 -
伝達 2 3 66 3 2 22 4 8 101 47 56 610 20 32 239 24 42 352 -
18 61 391 53 32 245 31 81 2,480 293 1,079 681 270 335 2,489 205 268 1,660 -
要求 - - - - - - - - - - - - - - - - - - -
3 1 - 0 3 - 6 3 - 262 1,897 - 1 5 - 3 12 - -
はい - - - - - - - - - - - - - - - - - - 616
いいえ - - - - - - - - - - - - - - - - - - 111
その他 - - - - - - - - - - - - - - - - - - 8,348
※ 縦軸は行為タイプ,横軸は対象タイプである.両タイプの組により作られる3$ \times$ 2の枠は,
上段が「過去」,下段が「非過去」,左が「否定」,中が「想像」,右が「実在」に該当する.
例えば,〔伝達,生理,過去,実在〕は66件である.「-」は出現し得ないことを表す.


0.8
表 5: 対話行為タグの分布(補助属性を考慮しない場合)
  生理 欲求 情緒 プラン 属性 その他 空白 合計
質問 14 9 13 468 81 563 - 1,148
  (0.1%) (0.0%) (0.0%) (1.8%) (0.3%) (2.1%)   (4.3%)
確認 80 42 99 615 436 607 - 1,879
  (0.3%) (0.2%) (0.4%) (2.3%) (1.6%) (2.3%)   (7.1%)
伝達 541 357 2,705 2,766 3,385 2,551 - 12,305
  (2.0%) (1.3%) (10.2%) (10.4%) (12.7%) (9.6%)   (46.3%)
要求 4 3 9 2,159 6 15 - 2,196
  (0.0%) (0.0%) (0.0%) (8.1%) (0.0%) (0.1%)   (8.3%)
はい - - - - - - 616 -
              (2.3%)  
いいえ - - - - - - 111 -
              (0.4%)  
その他 - - - - - - 8,348 -
              (31.4%)  


next up previous contents
次へ: 辞書の作成 上へ: タグ付きテキスト対話コーパスの構築 戻る: タグ付与の様子   目次
平成21年3月10日