《表4 数据不平衡处理分布》
由表2可得,训练集中类别U2R数量远小于类别Do S,使用不平衡的数据集,分类器会倾向于将数据分到多数类别中,容易忽略掉少数类别。为了解决数据不平衡产生的问题,本文使用SMOTE-ENN算法对训练集进行过采样和欠采样操作,增强训练数据的分布,平衡后的数据分布情况如表4所示。
图表编号 | XD00140338000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.10 |
作者 | 张浩、陈龙、魏志强 |
绘制单位 | 福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室、福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室、福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室 |
更多格式 | 高清、无水印(增值服务) |