次へ: 同義語対ごとの考察
上へ: 考察
戻る: 考察
目次
提案手法とベースライン手法の比較
表5.2のように,
提案手法とベースライン手法の正解率は,0.86と0.70であった.
提案手法はベースライン手法の正解率よりも高かった.
また,表5.3のように,
再現率高と中の同義語対全てと低の同義語対11組では,
ベースライン手法よりも提案手法の正解率の方が高い結果であった.
これは実験に使用した同義語対45組のうちの8割以上である.
これにより,
提案手法および機械学習で使用した素性は同義語の判別に十分有用であることが言える.
しかし,再現率低においては,差なしが4組,ベースライン手法の再現率の方が高い同義語対が2組あった.
原因として,同義語対の語の出現頻度に極端に差があることが考えられる.
今回設定したベースライン手法は,同義語対のうち出現頻度の多い方の語を全て分類先とするものなので,
出現頻度に極端に差があると再現率も極端に良くなる.
このため,ベースライン手法の方が良い場合があったものと思われる.
平成25年2月19日