《表1 Kittler提出的5种集成规则》
由于大多数基于SMOTE的过采样方法在计算K近邻后随机选择其中一个近邻进行线性插值,因此合成样本的质量与近邻的选择有很密切的关系。在选择其中一个近邻时可能会丢失由未选择的K-1个近邻所合成的高质量样本。因此,为了最大程度地保留具有价值的合成样本,从而进一步提高分类器的分类性能,本文将基于Bagging的集成学习方法与MOLAD结合,在采样阶段,移除了SMOTE算法中随机选择近邻这一步骤,针对每个少数类样本,根据MOLAD的K近邻计算策略求得并选取所有的K个近邻进行合成样本。因此最终会生成K个平衡的样本集。最后用Kittler等提出的5种集成规则[15]将K个平衡样本集训练得到的分类器集成。Kittler的5种集成规则如表1。
图表编号 | XD00134718100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 杨浩、陈红梅 |
绘制单位 | 西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院、云计算与智能技术高校重点实验室(西南交通大学) |
更多格式 | 高清、无水印(增值服务) |