《表7 各算法经过三种过采样的ROC和PR曲线下AUC值比较》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《面向非均衡数据的糖尿病并发症预测》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在实际应用中，通常将预测准确率分为两部分看待，既希望正样本的预测准确率高，又希望负样本的预测准确率高，基于此，学者们以FPR为横坐标，以TPR为纵坐标，连线构成ROC曲线分析结果，但是在数据极其不均衡的情况下，ROC曲线通常会呈现出一个过于乐观的评价。相比之下，对于着重少数样本的正确预测的情况，PR曲线则会因为精确率（Precision）的存在而不断地将假正例（FP）的影响显现出来。因此，本文综合分析ROC曲线和PR曲线来评价分类器的性能。ROC曲线下的AUC值越接近于1，则模型越能正确地分类正预测，从而减少假阳性。PR曲线下的AUC值越接近于1，表明模型越精确。以糖尿病肾病（D1）为例，先分别使用SMOTE和F＿SMOTE，再使用RF算法得到的ROC曲线和PR曲线如图3所示，可以看出F＿SMOTE要优于SMOTE。各并发症在各算法上得到的AUC值如表7所示。

图表编号	XD00212875600 严禁用于非法目的
绘制时间	2021.02.25
作者	邱云飞、郭蕾
绘制单位	辽宁工程技术大学软件学院、辽宁工程技术大学软件学院
更多格式	高清、无水印（增值服务）