次へ: 実験結果
上へ: SVM分離平面との距離に基づく素性分析
戻る: 4で得られた有用な可能性の高い素性を人手により検討する
目次
学習データは6章で用いたCase2におけるデータ(毎日新聞1992年7月)を用いて分析を行う.
本節で用いる学習データとテストデータの事例数を表8.1に示す.
表:
学習データとテストデータの事例数
|
学習データ |
テストデータ |
データ数 |
15,020 |
111,877 |
有用な素性の検討方法として以下に示す.
素性分析の結果は,1行につき素性1個のみの事例とその事例との分離平面との距離とその素性の分類先が出力される.
その出力結果を分離平面との距離が大きい順になるようにソートし,
ソートした結果内の分離平面との距離が大きい素性とデータ内の事例を人手により見比べ,
段落の順序推定に有用な素性を検討する.
平成27年3月4日