3.1式の集合A,集合Bはそれぞれマージする際に比較する,2つの類似した質問のノードから続く対話のパターン数である.
表3.2.4では,出現パターンの異なる質問3が2つ存在する.この2つの質問3は回答の種類が異なるので,完全一致している類似質問ではない.図3.5の点線部分がこのフローチャートの類似箇所である.
今回の例では,質問2の後に質問される質問3と,質問1の後に質問される質問3の2つである.質問2の後に質問される質問3から続く回答3-1,回答3-2,回答3-3の3種類の回答の集まりを集合Aとし,質問1の後に質問される質問3から続く回答3-1,回答3-2の2種類の回答の集まりを集合Bとする.このときの類似箇所の類似度は3.1式より,0.66と求めることができる. このように類似度を計算し,その値が0.2以上の時類似箇所のマージを行う.今回の例では類似度が0.66であるので質問3をマージする.
質問1 | 回答1 | 質問2 | 回答2 | 質問3 | 回答3 | |
クラスタ1 | クラスタ1 | クラスタ2 | クラスタ2 | クラスタ3 | クラスタ3 | |
対話1 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3 | 回答3-1 |
対話5 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3 | 回答3-2 |
対話4 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3 | 回答3-3 |
対話2 | 質問1 | 回答1-2 | 質問3 | 回答3-1 | ||
対話3 | 質問1 | 回答1-2 | 質問3 | 回答3-2 | ||
対話6 | 質問1 | 回答1-2 | 質問3 | 回答3-2 |
表3.2.5は表3.2.4の類似箇所である,異なる出現パターンの質問3をマージした表である.●はマージ先の質問を表し,#はマージ前の質問を表している.
また,図3.6は表3.2.5から作成した図3.5の類似箇所である点線部分をマージしたフローチャートである.
質問1 | 回答1 | 質問2 | 回答2 | 質問3 | 回答3 | |
クラスタ1 | クラスタ1 | クラスタ2 | クラスタ2 | クラスタ3 | クラスタ3 | |
対話1 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3● | 回答3-1 |
対話5 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3● | 回答3-2 |
対話4 | 質問1 | 回答1-1 | 質問2 | 回答2-1 | 質問3● | 回答3-3 |
対話2 | 質問1 | 回答1-2 | 質問2 | 回答2-1 | 質問3 | 回答3-1 |
対話3 | 質問1 | 回答1-2 | 質問2 | 回答2-1 | 質問3 | 回答3-2 |
対話6 | 質問1 | 回答1-2 | 質問2 | 回答2-1 | 質問3 | 回答3-2 |
対話2 | 質問1 | 回答1-2 | 質問3# | |||
対話3 | 質問1 | 回答1-2 | 質問3# | |||
対話6 | 質問1 | 回答1-2 | 質問3# |