《表2 各种采样处理之后的结果》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进的SMOTE采样Catboost分类算法》
从上表我们可以很明显的看到,原始没有经过采样处理的训练数据集,随机森林经过训练学习之后,在测试集上得到的召回率只有84.22%,而经过采样处理之后的训练数据集,在随机森林训练学习之后,测试集上的召回率相比于之前没做采样处理的结果都有了较为明显的上升,也就是模型对于少数类的识别率有了很大的提高,这其中召回率提升最为明显的就是本文新提出来的AK-SMOTE采样方法,它的召回率效果相对于其他采样处理方法,召回率达到了97.13%,在提高对于少数类分类的识别率上有了很大的提升。但是模型的AUC值却是所有结果当中最低的,也就是模型的整体泛化能力有所欠缺,因而必须找到更好的分类学习器来代替随机森林模型。
图表编号 | XD00132679400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 张德鑫、雒腾、曾志勇 |
绘制单位 | 云南财经大学统计与数学学院、云南财经大学统计与数学学院、云南财经大学统计与数学学院 |
更多格式 | 高清、无水印(增值服务) |