《表2 Recall性能对比》

《表2 Recall性能对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于样本学习复杂度的不平衡数据过采样方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表2中可以看出,在多数数据集上,使用采样方法平衡样本的分类算法在召回率上都要优于原始的分类算法。实际上,过采样方法通过增加少数类样本调整训练集的数据分布,强调了少数类对学习过程中的贡献度,从而扩张了少数类的决策空间,使得正类样本被正确预测的样本数增多,正类样本被错误预测的样本数减少,所以召回率Recall值比原始的分类结果要好。另一方面,LDSMOTE算法在11个数据集上取得了最优的Recall值,表明了它对少数类的识别率较大。