《表4 5种特征选择方法在均匀训练集上的性能比较》
经过清除稀有词汇,均匀训练集中有3353个特征项,通过属性约简取130个特征项。对于5种方法分别独立运行20次,得到其在均匀数据集上特征选择的平均值。表4中列出了5种方法在均匀训练集上的特征选择情况,通过属性约简大幅降低了数据向量空间的维度。可以看出,RS方法在查全率和准确率上均优于其他方法,表现出更好的文本分类性能。
图表编号 | XD00194446300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.25 |
作者 | 曹守富、蒋慧平、谭阳 |
绘制单位 | 湖南广播电视大学教育信息技术中心、湖南网络工程职业学院网络技术学院、湖南网络工程职业学院网络技术学院 |
更多格式 | 高清、无水印(增值服务) |