文レベルでの評価結果

データ1で生成された表の列は10列,データ2で生成された表の列は9列であり,その内2つの間で類似している列は6列ありその列で評価を行った.データ2でも生成されたデータ1のテンプレートを表5.3.4,表5.3.5にて示す.


Table 5.3.4: データ2でも生成されたデータ1のテンプレート(1/2)
出身 日本 卒業
頻度数 テンプレート 頻度数 テンプレート 頻度数 テンプレート
67 X2X1 5 X0は、X1のX2 8 X3X1
19 X2 2 X0は、X1のX2、X5 3 X3X3X3X3X1
5 X2X2X1 1 X0は、X1のX2、X2である 2 X3X3X1
2 X2X2X2X1 1 X0はX1のX2 1 X3、X3X1
2 X2X1、X2X1 1 X0は、X1のX2、X2    
    1 X0は、X1のX2、X5、X2    


Table 5.3.5: データ2でも生成されたデータ1のテンプレート(2/2)
血液型 本名 所属
頻度数 テンプレート 頻度数 テンプレート 頻度数 テンプレート
9 X3X7X7 4 X1同じ 7 X2X1
5 X1はAX2 4 X1、X3 2 X3X1
5 X1X2 1 X1:X0    
4 X1AX2        
4 X1はOX2        
3 X1はX2        
2 X1OX2        
1 X3X3        

次にデータ1でも生成されたデータ2のテンプレートを表5.3.6,表5.3.7にて示す.


Table 5.3.6: データ1でも生成されたデータ2のテンプレート(1/2)
出身 日本 卒業
頻度数 テンプレート 頻度数 テンプレート 頻度数 テンプレート
58 X2X1 10 X0は、X1のX2 10 X3X1
21 X2 8 X0は、X1のX2、X2 1 X3X3X3X3X1
4 X2X2X1 2 X0は、X1のX2、X2である 1 X3X3X1
2 X2X2X2X1 2 X0は、X1のX2、X5 1 X3、X3X1
1 X2X1、X2X1 1 X0はX1のX2    
    1 X0は、X1のX2、X5、X2    


Table 5.3.7: データ1でも生成されたデータ2のテンプレート(2/2)
血液型 本名 所属
頻度数 テンプレート 頻度数 テンプレート 頻度数 テンプレート
11 X3X7X7 1 X1同じ 28 X3X1
9 X1はOX2 1 X1、X3 2 X2X1
5 X1はAX2 1 X1:X0    
4 X1はX2        
3 X1OX2        
3 X1AX2        
1 X1X2        
1 X3X3        

次に,データ1を正解データ,データ2を実験データとした時のカバー率と,データ2を正解データ,データ1を実験データとした時のカバー率をそれぞれ式5.1で求める.結果を表5.3.8,表5.3.9に示す.

6列でのカバー率の平均の結果は共に0.33,0.44と低い結果だが,「出身」の列や「血液型」では高いカバー率となっており,共通して生成されたテンプレートが高い頻度で生成されることが確認できた.


Table 5.3.8: データ1のテンプレートの評価結果

71#71



Table 5.3.9: データ2のテンプレートの評価結果
72#72