《表4 基于DNN3分类器上各特征合成方法的比较》

《表4 基于DNN3分类器上各特征合成方法的比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多重属性过滤深度特征合成算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表2~表4给出了所选择3个数据集上不同分类器(SVM、C4.5和DNN3)采用5折交叉验证法所获得的分类准确率和特征数。其中DFS是深度特征合成算法生成的特征集合,HJDFS是使用本文提出的改进算法生成的特征集合,同时为了比较算法在相同特征数量上的优劣,在对生成后的特征集合进行了数据清洗和规范后,使用截断的SVD分解[14-16]对从DFS和HJDFS生成的特集合选择了相同数量特征,组成了特征集合DFS-SVD和HJDFS-SVD。且根据表2~表4所示的实验结果,改进的算法HJDFS在三个数据集上所生成特征数量比算法DFS要分别少24.3%、38.9%,和39.3%。算法HJDFS在三种不同分类器上的平均准确率提升分别为0.826%、0.227%和0.275%,在三个数据集上使用SVM分类器的准确率提升为0.771%、0.439%和1.267%,在DNN3分类器上的准确率提升分别为0.546%、0.923%和0.358%,在C4.5分类器上也均有提升。在对DFS和HJDFS使用截断的SVD分解取得的相同数量的特征集合上,算法HJDFS的准确率提升更加明显,HJDFS-SVD相较于DFS-SVD在三种不同分类器上的平均准确率提升分别为1.221%、0.674%和0.683%,在三种不同的分类器上均有不同程度的提升,这是因为在DFS算法合成特征的过程中,实体内不重要的属性与重要的属性融合,使得合成的特征在普通特征选择算法上难以区分,从而在对特征集合进行特征提取之后,准确率反而下降。