次へ: 再現率高の例
上へ: 考察
戻る: 提案手法とベースライン手法の比較
目次
同義語対ごとの考察
分類を行った再現率の高さごとに同義語対を2組ずつ例として挙げ,
その同義語対の使い分けに関する考察を行う.
それぞれの例には,機械学習が正しく判定した正解例と
機械学習が誤って判定した誤り例を同義語対ごとに1例ずつの計4例と,
機械学習が判定を行う際に参考にした素性とその素性の正規化α値を示す.
正規化α値とは,最大エントロピー法で求まるα値を全分類先での合計が1となるように正規化した値である.
各素性の,分類先ごとに与えられた正規化α値が高いほど,その分類先であることを推定するのに重要な素性であることを意味する.
例えば,ある素性Sのある分類先Aに対する正規化α値がXとすると,
その素性Sのみで分類を行った場合,分類先Aと推定する確率がXとなることを意味する.
ここで示す素性のうち,
「デフォルト素性」は常に利用されるデフォルトの素性であり,
他に情報がなければこの素性のみにより分類先が決定される.
Subsections
平成25年2月19日