《表6 KDD Cup数据集不同采样方法的AUC值对比》

《表6 KDD Cup数据集不同采样方法的AUC值对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《采用混合模型的电信领域用户流失预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由表5可以看出AUC值整体偏低,贝叶斯的敏感度虽然高,然而整体准确率却特别的低,影响整体效果并不适用于电信领域。除逻辑回归和多层感知机外,其他模型敏感度极低。造成此原因是因为在真实的电信领域下离网率大概只有2%~5%,离网率过小对实验结果有较大的影响。Gradient Boosting、AdaBoost等分类器虽能保持较高的准确率,但找出的流失用户过少,对电信公司并没有实际意义。需要将AUC值和敏感度同时考虑才可使该方法更好地应用到电信领域,本文使用过采样和欠采样方法来解决这一问题。过采样中朴素随机过采样、SMOTE、ADASYN三种方法以及欠采样在不同模型下KDD Cup数据集AUC值和敏感度的对比结果见表6、表7。不同模型下某电信运营商数据AUC值的对比结果见表8、表9。