《表6 KDD Cup数据集不同采样方法的AUC值对比》
由表5可以看出AUC值整体偏低,贝叶斯的敏感度虽然高,然而整体准确率却特别的低,影响整体效果并不适用于电信领域。除逻辑回归和多层感知机外,其他模型敏感度极低。造成此原因是因为在真实的电信领域下离网率大概只有2%~5%,离网率过小对实验结果有较大的影响。Gradient Boosting、AdaBoost等分类器虽能保持较高的准确率,但找出的流失用户过少,对电信公司并没有实际意义。需要将AUC值和敏感度同时考虑才可使该方法更好地应用到电信领域,本文使用过采样和欠采样方法来解决这一问题。过采样中朴素随机过采样、SMOTE、ADASYN三种方法以及欠采样在不同模型下KDD Cup数据集AUC值和敏感度的对比结果见表6、表7。不同模型下某电信运营商数据AUC值的对比结果见表8、表9。
图表编号 | XD00119587300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.15 |
作者 | 汪明达、周俏丽、蔡东风 |
绘制单位 | 沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心 |
更多格式 | 高清、无水印(增值服务) |