next up previous contents
次へ: 素性分析の考察 上へ: SVM分離平面との距離に基づく素性分析 戻る: 実験条件   目次

実験結果

素性分析手順3により得られた,各素性における分離平面との距離の結果を以下に示す. データ内の形式は「分類先,分離平面との距離@付与された素性」である. ``分類先''とは学習に基づきテストデータ内の各事例に``付与された素性'' に対しての分類先を示す8.2. 枠内の``R,0.329129@一文比率区間:0、5〜1''を例に挙げると, 一文比率区間(段落A→B,またはB→A間の隣接する各1文内に出現する単語の共起数をそれぞれ求め,求められた2つの値から比率を算出する)によって求められた値が0.5から1の間にある場合にR(段落B)に推定されやすいことを示している(数値である0.329129は用いた素性における分離平面との距離の値を示す).

[
l]各素性における分離平面との距離の結果(一部) R,0.329129@一文比率区間:0、5〜1
L,0.319304@一文区間:0〜1
L,0.317089@比率:0〜
L,0.305045@P一致数:10
L,0.296821@P比率区間:0〜0、5
L,0.296549@一文比率区間:0〜0、5
L,0.295711@P一致数:8
L,0.295643@LR類似数R×:1 
L,0.295486@LR類似数R×:2 
L,0.292465@P一致数:3
L,0.290423@P一致数:7
L,0.285407@P類似数L○:1 
L,0.285366@L日付け:1
R,0.285301@P一文一致数:2
L,0.275282@R日付け:0
L,0.275282@L新名詞:日
R,0.273244@比率:1、5
L,0.262242@P一致数:4
L,0.261228@P一文一致数:3

また, 人手により検討した.検討した結果,有用と思われた素性を表8.2に示す 8.3




表: 人手による検討結果(推定段落A,B)
素性 素性ID 素性の説明 どの段落に分類する際に有用か
一文比率区間:0、5〜1 b23 b23で求めた値が0.5から1の間 段落Bが先になる場合
一文区間:0〜1 b22 b22で求めた値が0から1の間 段落Aが先になる場合
P一致数:7  b28 b28で求めた値が7以上 段落Aが先になる場合
L日付け:1 a4 段落A内に日付を含む 段落Aが先になる場合
P一文一致数:3 b24 b24で求めた値が3以上 段落Aが先になる場合
P比率:4 b29 b29で求めた値が4以上 段落Aが先になる場合
LR類似数R×:2〜4 a7 a7で求めた値が2から4の間 段落Bが先になる場合
P類似数L○:4〜6 a14 a14で求めた値が4から6の間 段落Aが先になる場合
L特定品詞:1 a3 段落A内初めの文頭に連体詞または接続詞を含む 段落Bが先になる場合
R名詞:同 a1 段落B内に名詞「同」を含む 段落Aが先になる場合


next up previous contents
次へ: 素性分析の考察 上へ: SVM分離平面との距離に基づく素性分析 戻る: 実験条件   目次
平成27年3月4日