《表4 基于DNN3分类器上各特征合成方法的比较》
表2~表4给出了所选择3个数据集上不同分类器(SVM、C4.5和DNN3)采用5折交叉验证法所获得的分类准确率和特征数。其中DFS是深度特征合成算法生成的特征集合,HJDFS是使用本文提出的改进算法生成的特征集合,同时为了比较算法在相同特征数量上的优劣,在对生成后的特征集合进行了数据清洗和规范后,使用截断的SVD分解[14-16]对从DFS和HJDFS生成的特集合选择了相同数量特征,组成了特征集合DFS-SVD和HJDFS-SVD。且根据表2~表4所示的实验结果,改进的算法HJDFS在三个数据集上所生成特征数量比算法DFS要分别少24.3%、38.9%,和39.3%。算法HJDFS在三种不同分类器上的平均准确率提升分别为0.826%、0.227%和0.275%,在三个数据集上使用SVM分类器的准确率提升为0.771%、0.439%和1.267%,在DNN3分类器上的准确率提升分别为0.546%、0.923%和0.358%,在C4.5分类器上也均有提升。在对DFS和HJDFS使用截断的SVD分解取得的相同数量的特征集合上,算法HJDFS的准确率提升更加明显,HJDFS-SVD相较于DFS-SVD在三种不同分类器上的平均准确率提升分别为1.221%、0.674%和0.683%,在三种不同的分类器上均有不同程度的提升,这是因为在DFS算法合成特征的过程中,实体内不重要的属性与重要的属性融合,使得合成的特征在普通特征选择算法上难以区分,从而在对特征集合进行特征提取之后,准确率反而下降。
图表编号 | XD00163021100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 王立可、崔小莉、张力戈 |
绘制单位 | 中国科学院成都计算机应用研究所、中国科学院大学、四川虹信软件股份有限公司、中国科学院成都计算机应用研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |