《表5 数据不平衡处理前后样本数量》

《表5 数据不平衡处理前后样本数量》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《软件缺陷预测中的数据预处理方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了证明本文提出的改进的Borderline-SMOTE算法的有效性,本实验分别使用原始和改进的Borderline-SMOTE方法进行数据不平衡处理,实验使用的项目分别是:bugzilla、columba、jdt,mozilla、platform、postgres,处理前后的样本数量见表5。改进的Borderline-SMOTE方法与原始方法相比,只会更改新合成样本的特征值,使特征值更符合真实情况,并不会改变新合成样本的数量,因此使用两种方法处理后的缺陷样本数量一致。