テストデータを用いてプログラムによりレスの宛先をデータ構造化し,用意した 辞書を利用して,レスからの情報抽出を行い,情報を集約する.情報の集約を行わなかった結果と情報の集約を行った結果を出力し,正解データ とそれぞれ比較することで,集約の効果を確認する.
評価方法は,各レスごとに正解データの3つ組と出力の3つ組を比較し,出力数, 一致数を出す. さらに,出力数および一致数から以下の式により適合率,再現率,および 値を計算 する.
各レスごとの適合率,再現率,および 値を求めて,それらからマクロ平均を計算し, 性能の評価として利用する.
マクロ平均とは,各レスの適合率,再現率, および 値を計算してから,それらを平均することである.すなわち で求める.ここで, はレス数, は 番 目のレスにおける,適合率,再現率,または 値である.
なお,全てのレスの出力数,一致数の合計を計算して,それらから適合率,再現率,および 値を計算するのがマイクロ平均である.