MF同一後続類似ノード融合手法

MF同一後続類似ノード融合手法は,フローチャートの類似する質問をマージ候補とし,マージ候補以降の対話の内容の類似度を求め,その値が0.2以上の場合マージを行う手法である. 類似度の計算は,Jaccard係数を用いて求める.Jaccard係数J(A,B)は以下の式で定義される.

 

2#2 (3.1)

3.1式の集合A,集合Bはそれぞれマージする際に比較する,2つの類似した質問のノードから続く対話のパターン数である.

3.2.4では,出現パターンの異なる質問3が2つ存在する.この2つの質問3は回答の種類が異なるので,完全一致している類似質問ではない.図3.5の点線部分がこのフローチャートの類似箇所である.

今回の例では,質問2の後に質問される質問3と,質問1の後に質問される質問3の2つである.質問2の後に質問される質問3から続く回答3-1,回答3-2,回答3-3の3種類の回答の集まりを集合Aとし,質問1の後に質問される質問3から続く回答3-1,回答3-2の2種類の回答の集まりを集合Bとする.このときの類似箇所の類似度は3.1式より,0.66と求めることができる. このように類似度を計算し,その値が0.2以上の時類似箇所のマージを行う.今回の例では類似度が0.66であるので質問3をマージする.


表: 類似箇所の内容が異なる時の表
  質問1 回答1 質問2 回答2 質問3 回答3
  クラスタ1 クラスタ1 クラスタ2 クラスタ2 クラスタ3 クラスタ3
対話1 質問1 回答1-1 質問2 回答2-1 質問3 回答3-1
対話5 質問1 回答1-1 質問2 回答2-1 質問3 回答3-2
対話4 質問1 回答1-1 質問2 回答2-1 質問3 回答3-3
対話2 質問1 回答1-2       質問3 回答3-1
対話3 質問1 回答1-2      質問3 回答3-2
対話6 質問1 回答1-2       質問3 回答3-2

図: 類似箇所の内容が異なる時のフローチャート
Image teian3_mae

3.2.5は表3.2.4の類似箇所である,異なる出現パターンの質問3をマージした表である.●はマージ先の質問を表し,#はマージ前の質問を表している.

また,図3.6は表3.2.5から作成した図3.5の類似箇所である点線部分をマージしたフローチャートである.


表: MF同一後続類似ノード融合手法でマージした表
  質問1 回答1 質問2 回答2 質問3 回答3
  クラスタ1 クラスタ1 クラスタ2 クラスタ2 クラスタ3 クラスタ3
対話1 質問1 回答1-1 質問2 回答2-1 質問3● 回答3-1
対話5 質問1 回答1-1 質問2 回答2-1 質問3● 回答3-2
対話4 質問1 回答1-1 質問2 回答2-1 質問3● 回答3-3
対話2 質問1 回答1-2 質問2 回答2-1 質問3 回答3-1
対話3 質問1 回答1-2 質問2 回答2-1 質問3 回答3-2
対話6 質問1 回答1-2 質問2 回答2-1 質問3 回答3-2
対話2 質問1 回答1-2       質問3#  
対話3 質問1 回答1-2      質問3#  
対話6 質問1 回答1-2       質問3#  

図: MF同一後続類似ノード融合手法でマージしたフローチャート
Image teian3_ato