《表3 应用不同NearMiss距离CCNM在SVM上的F-M easure (G-M ean)》

《表3 应用不同NearMiss距离CCNM在SVM上的F-M easure (G-M ean)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种改进型的不平衡数据欠采样算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表3可以看出,应用NearMiss-2后的CCNM有着更为出色的表现,从选择策略上也可以发现,NearMiss-2会从全局角度考虑多数类与少数类的距离,通过这种方式选出的多数类会均匀的分布在少数类的周围,从而更容易找出分类界限.NearM iss-1从局部着手,只考虑最近的那么三个,选出的多数类不会均匀分布在少数类周围.会出现某些少数类周围有大量多数类,而某些周围几乎没有.那么,大量多数类环绕着少数类就会导致很低的查全率(recall),相反则会导致很低的查准率(pre-cision).NearMiss-3虽然会“刻意”使少数类周围有一定量的多数类,但局部仍然会出现某一类样本密集,导致少数类预测(PositiveAccuracy)、多数类预测(NegativeAccuracy)都不够理想.