SVMの素性

SVMの素性分析の結果で得られた賛成を得やすい素性,賛成を得にくい素性を上位30個並べる.コメントの文字数の素性は上位10個並べる.




Table 4.5: SVMの素性
順位 賛成を得やすい素性 マージン 賛成を得にくい素性 マージン
1 予防 1.1266 幼稚 -1.0790
2 現場 1.0976 基準 -1.0733
3 認める 0.9750 創価学会 -1.0163
4 任意 0.9528 バカ -0.9893
5 限界 0.9017 泥棒 -0.9803
6 うーん 0.8870 問う -0.9716
7 すみ 0.8752 期日 -0.9410
8 子育て 0.8462 育成 -0.9268
9 経費 0.8377 ゴリ押し -0.9227
10 製品 0.8154 失脚 -0.9087
11 実態 0.7956 ズレ -0.9049
12 応援 0.7781 余っ -0.8911
13 済む 0.7756 ケース -0.8568
14 意地 0.7716 実験 -0.8329
15 宮内庁 0.7692 代わり -0.8295
16 疾患 0.7621 予約 -0.8265
17 実際 0.7565 搬送 -0.8227
18 一連 0.7448 既に -0.8141
19 分配 0.7399 いちいち -0.8051
20 なし崩し 0.7377  貴方 -0.8014
21 守ろ 0.7272 ガソリン -0.7860
22 すげ 0.7240 早め -0.7859
23 持た 0.7183 歴代 -0.7810
24 自治体 0.7152 パート -0.7792
25 自動車 0.7147 うっ -0.7576
26 0.7023 格好 -0.7514
27 とき 0.6987 みなさん -0.7383
28 見直し 0.6974 理不尽 -0.7344
29 先ず 0.6936 絡み -0.7341
30 人材 0.6905 やん -0.7333




Table 4.6: SVMの素性(文字数素性なし)
順位 賛成を得やすい素性 マージン 賛成を得にくい素性 マージン
1 現場 1.1244 幼稚 -1.0838
2 予防 1.0615 基準 -1.0281
3 任意 0.9417 バカ -1.0081
4 認める 0.9054 泥棒 -0.9929
5 限界 0.8718 問う -0.9911
6 すみ 0.8662 余っ -0.9617
7 うーん 0.8660 創価学会 -0.9500
8 子育て 0.8354 期日 -0.9172
9 意地 0.8146 失脚 -0.9165
10 製品 0.8120 育成 -0.8986
11 実態 0.8103 ズレ -0.8868
12 済む 0.7955 実験 -0.8842
13 応援 0.7919 ゴリ押し -0.8752
14 宮内庁 0.7846 ケース -0.8660
15 実際 0.7740 予約 -0.8516
16 経費 0.7543 代わり -0.8254
17 守ろ 0.7391 歴代 -0.8075
18 見直し 0.7362 貴方 -0.8055
19 疾患 0.7283 既に -0.7908
20 とき 0.7249  早め -0.7906
21 分配 0.7194 格好 -0.7681
22 人材 0.7168 やん -0.7640
23 上手い 0.7130 いちいち -0.7572
24 一連 0.7081 みなさん -0.7488
25 なし崩し 0.7042 搬送 -0.7481
26 自治体 0.6996 理不尽 -0.7384
27 払う 0.6962 -0.7274
28 同調 0.6955 パート -0.7240
29 すげ 0.6950 お前 -0.7149
30 自動車 0.6859 絡み -0.7124




Table 4.7: SVMの素性(文字数素性のみ)
順位 賛成を得やすい素性 マージン 賛成を得にくい素性 マージン
1 L200より大きい 0.1507 L200以下 -0.1507
2 R200より大きい 0.1507 R200以下 -0.1507
5 L100より大きい 0.1205 L100以下 -0.1205
6 R100より大きい 0.1205 R100以下 -0.1205
3 L20以下 0.0830 L20より大きい -0.0830
4 R20以下 0.0830 R20より大きい -0.0830
7 L50以下 0.0458 L50より大きい -0.0458
8 R50以下 0.0458 R50より大きい -0.0458
9 L10より大きい 0.0368 L10以下 -0.0368
10 R10より大きい 0.0368 R10以下 -0.0368

4.5と表4.6からMEと同様に文字数の素性の有無では賛成を得やすい文章,賛成を得にくい文章の素性にはあまり変化が見られなかった.SVMの文字数素性だけを抜き出したのが表4.7である.表4.7からは200字より多い文字数の文章が一番賛成を得やすい文量だと読み取れる.