- 対話データを質問文と回答文に分ける.
- 質問文について,文中の名詞の単語ベクトルの総和を質問文ベクトルとする.
- 質問文をx-means法[3]でクラスタリングし,表に整理する.
- (3)で生成した質問文の表に対応するように,回答文の表を生成する.
- (4)で生成した回答文の表について,列ごとに含まれる回答文を再度x-means法でクラスタリングし,対応するクラスタ番号を回答文の先頭に付与する.
- 質問文の表と回答文の表の対応する列を取り出し,質問回答...の順で整理する.また,表の左右方向は列に含まれる文の出現箇所の平均が小さい順にソートする.
- 5で生成された表について,人手で修正後,回答文に付与されたクラスタ番号を元にソートをかける.