《表1 数据库结构:基于分解策略处理多分类不均衡问题的方法》
为了评估算法的性能,本文采用KEEL上17个数据集对DRCW-SEG算法进行测试。表1描述了所选择的数据集的信息,包括数据集编号(ID)、样本数(#ex.)、属性数(#atts.)、数值属性数(#num.)、名义属性数(#nom.)、类别数(#C1)、类别分布(#Dc.)、不平衡率(IR)。其中,不平衡率由最多类样本数/最少类样本数得到。本文采用三次五折交叉验证法对本文算法进行分析,即实验时首先将数据集中的样本随机分为大小相似的五份,并且尽可能保持数据分布的一致性,然后,每次取其中的四份进行训练,剩下的样本作为测试集,计算预测结果,这样就可以获得五个测试结果,返回五个测试结果的平均值。重复进行三次这样的操作,三次的平均值作为最终预测结果。
图表编号 | XD00198018700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.05 |
作者 | 徐作宁、雒兴刚、张忠良 |
绘制单位 | 杭州电子科技大学管理学院、杭州电子科技大学管理学院、杭州电子科技大学管理学院 |
更多格式 | 高清、无水印(增值服务) |