《表7 各算法经过三种过采样的ROC和PR曲线下AUC值比较》

《表7 各算法经过三种过采样的ROC和PR曲线下AUC值比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向非均衡数据的糖尿病并发症预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在实际应用中,通常将预测准确率分为两部分看待,既希望正样本的预测准确率高,又希望负样本的预测准确率高,基于此,学者们以FPR为横坐标,以TPR为纵坐标,连线构成ROC曲线分析结果,但是在数据极其不均衡的情况下,ROC曲线通常会呈现出一个过于乐观的评价。相比之下,对于着重少数样本的正确预测的情况,PR曲线则会因为精确率(Precision)的存在而不断地将假正例(FP)的影响显现出来。因此,本文综合分析ROC曲线和PR曲线来评价分类器的性能。ROC曲线下的AUC值越接近于1,则模型越能正确地分类正预测,从而减少假阳性。PR曲线下的AUC值越接近于1,表明模型越精确。以糖尿病肾病(D1)为例,先分别使用SMOTE和F_SMOTE,再使用RF算法得到的ROC曲线和PR曲线如图3所示,可以看出F_SMOTE要优于SMOTE。各并发症在各算法上得到的AUC值如表7所示。