next up previous contents
次へ: 単語1〜5-gram素性での性能 上へ: 実験 戻る: 参照文数の違いによる性能差   目次

素性の種類ごとの性能差

情緒推定に用いる,素性の違いによる性能差を調査する.



表: 素性のみ実験結果
 手法 適合率 再現率 F値   (出力数, 一致数)  
 W1G 0.4444 0.3470 0.3897   (17,176, 7,633)  
 W2G 0.4592 0.3641 0.4061   (17,441, 8,009)  
 W3G 0.4476 0.3530 0.3947   (17,348, 7,765)  
 W4G 0.4092 0.3203 0.3593   (17,220, 7,046)  
 W5G 0.3415 0.2656 0.2988   (17,110, 5,843)  
 SOS 0.1295 0.1221 0.1257   (20,737, 2,686)  
 KR2 0.1829 0.1421 0.1599   (17,090, 3,126)  
 KR4 0.2933 0.2279 0.2565   (17,093, 5,014)  
 KR5 0.3050 0.2388 0.2679   (17,225, 5,253)  
 PKR2 0.2173 0.1687 0.1899   (17,081, 3,711)  
 PKR4 0.2833 0.2216 0.2486   (17,207, 4,874)  
 PKR5 0.2306 0.1824 0.2037   (17,401, 4,013 )  
 DA 0.1532 0.1190 0.1339   (17,079, 2,617)  
 EDA 0.1817 0.1411 0.1589   (17,080, 3,104)  
 MS 0.2045 0.1639 0.1819   (17,632, 3,605)  
 SP 0.1967 0.1533 0.1723   (17,145, 3,372)  

単語をn-gramを含まない素性の場合,性能が低い.情緒推定の内訳を見てみると,単語n-gram以外の素性の場合 は情緒の内どれか1つに出力が極端に偏る傾向が確認できた.正解情緒タグの割合と無関係に「期待」や「悲しみ」 等,完全にランダムで出力の偏りは半分近くにもおよぶ.一方,単語n-gramの場合は「喜び」,「嫌だ」,「なし」 の順に出力が多く表れ,正解情緒の割合とある程度似た傾向を示す結果となった.これは,ラベルやコードのみでは 抽象度が大きすぎるため,正確な推定ができなかったと考える.


next up previous contents
次へ: 単語1〜5-gram素性での性能 上へ: 実験 戻る: 参照文数の違いによる性能差   目次
平成25年1月15日