《表4 5种特征选择方法在均匀训练集上的性能比较》

《表4 5种特征选择方法在均匀训练集上的性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于粗糙集的社交文本特征选择方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

经过清除稀有词汇,均匀训练集中有3353个特征项,通过属性约简取130个特征项。对于5种方法分别独立运行20次,得到其在均匀数据集上特征选择的平均值。表4中列出了5种方法在均匀训练集上的特征选择情况,通过属性约简大幅降低了数据向量空间的维度。可以看出,RS方法在查全率和准确率上均优于其他方法,表现出更好的文本分类性能。