《表1 算法HJDFS与DFS合成特征及模型训练时间对比》
min
图1给出了本文提出的HJDFS算法和原算法DFS在三个数据集上合成特征时耗费时间对比图,改进的算法对原实体集合做多重属性过滤,使更少的属性参与特征合成,时间耗费大幅度减少。改进的HJDFS算法的时间耗费相较于DFS在三个数据集上均有明显减少,减少比例分别为23.7%、24.4%和40.3%。HJDFS算法不仅在合成特征时具有时间优势,在对合成的特征使用机器学习算法训练时,也有明显优势。表1给出了算法HJDFS与DFS合成特征及模型训练时间(min)对比,改进的算法在不同的机器学习模型上均有明显效率提升,其中在SVM分类器模型上,平均训练时间减少31.41%,在C4.5分类器模型上,平均训练时间减少21.87%,在DNN3分类器模型上,平均训练时间减少21.53%。时间性能的提升可以加快算法反馈效率,成倍增加模型调优的效率,改进的算法在实际应用中具有极高的使用价值。
图表编号 | XD00163021200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 王立可、崔小莉、张力戈 |
绘制单位 | 中国科学院成都计算机应用研究所、中国科学院大学、四川虹信软件股份有限公司、中国科学院成都计算机应用研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |