評価手順を以下に示す.
手順1 | 作成した正解テーブルの各列に注目する. |
手順2 | 注目している列と出力デーブルの各列のF1値を計算する. |
手順3 | 手順2で計算した結果の中で最も高い数値をこの注目している列のF1値として扱う. |
手順4 | 手順2と手順3のすべての正解の列に対して行い,各列のF値の平均を求め,これを出力テーブルの評価結果とする. |
交通事故の実験データで1回クラスタリングの1番目の列(表)を利用して,提案手法を使って実験で生成されたテーブルを表に示す.表と表を例として, F1の計算方法を以下で示す.
正解テーブル(表)の列1と出力テーブル(表)の列1,列2,列3,列4,列5,列6の6個のF1値を計算して,この中に数値が最も高い数値を正解テーブルの列1のf1値として扱います.同じ手順で正解テーブル(表)の列2と出力テーブル(表)の列1,列2,列3,列4,列5,列6を使って,正解テーブル(表)の列2のF1値を計算する.同じ手順で正解テーブルの全部の列のF1値を計算することができる.これらの値の平均値を正解テーブル(表3)のF1値として扱う.
1回目のクラスタリング結果の列のF1値を計算することができる.これらのF1値のなかに最も高い三つのF1値の平均値をこの実験データのF1値として扱う.すべでのデータのF1結果を表に示す.
また,評価結果の差が有意かを調べるために,対応のある両側t検定を行った.有意水準は0.05とした.有意差検定の結果を表に示す.