表作成の手順

  1. 対話データを質問文と回答文に分ける.
  2. 質問文について,文中の名詞の単語ベクトルの総和を質問文ベクトルとする.
  3. 質問文をx-means法[3]でクラスタリングし,表に整理する.
  4. (3)で生成した質問文の表に対応するように,回答文の表を生成する.
  5. (4)で生成した回答文の表について,列ごとに含まれる回答文を再度x-means法でクラスタリングし,対応するクラスタ番号を回答文の先頭に付与する.
  6. 質問文の表と回答文の表の対応する列を取り出し,質問回答...の順で整理する.また,表の左右方向は列に含まれる文の出現箇所の平均が小さい順にソートする.
  7. 5で生成された表について,人手で修正後,回答文に付与されたクラスタ番号を元にソートをかける.