《表6 基于不同算法得到的宏观G均值》
结束语随着大数据时代的发展,不平衡数据分类问题的研究受到了广泛关注,然而由于数据集在数量上严重失衡,传统的学习方法不能有效地对其进行学习。本文从代价敏感学习入手,提出了样本自适应的代价敏感策略。通过考察正类样本近邻中类别的分布情况,判断其距离两类样本边界的远近,并为距离两类样本边界越近的样本赋予越高的权重,同时保证正类样本的权重总和与负类相同,以此提升正类样本的预测精度。本文将提出的样本自适应的代价敏感策略应用于LDM,并通过一系列实验验证了样本自适应的不平衡分类器可以有效处理不平衡数据的分类问题。后续的工作拟将样本自适应策略应用于多分类问题。
图表编号 | XD0035514500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.15 |
作者 | 才子昕、王馨月、徐剑、景丽萍 |
绘制单位 | 北京交通大学交通数据分析与挖掘北京市重点实验室、北京交通大学交通数据分析与挖掘北京市重点实验室、北京交通大学交通数据分析与挖掘北京市重点实验室、北京交通大学交通数据分析与挖掘北京市重点实验室 |
更多格式 | 高清、无水印(增值服务) |