《表1 0 KDDCup数据集朴素随机过采样和投票分类器相结合》

《表1 0 KDDCup数据集朴素随机过采样和投票分类器相结合》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《采用混合模型的电信领域用户流失预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由表6和图4可以看出采用朴素随机过采样后,AdaBoost和GradientBoosting的AUC值较高,Adaboost是通过提升错分数据点的权重来定位模型的不足,具有很高的精度,而Gradient Boosting是通过算梯度来定位模型的不足,可以灵活处理各种类型的数据,包括连续值和离散值。本文采用朴素随机过采样后又进行一次投票分类将两者结合产生一个新模型进行预测,实验结果表明两种分类器相结合适用于电信领域的数据,使用一次投票分类之后实验结果进一步提升,见表10。