《表7 各算法经过三种过采样的ROC和PR曲线下AUC值比较》
在实际应用中,通常将预测准确率分为两部分看待,既希望正样本的预测准确率高,又希望负样本的预测准确率高,基于此,学者们以FPR为横坐标,以TPR为纵坐标,连线构成ROC曲线分析结果,但是在数据极其不均衡的情况下,ROC曲线通常会呈现出一个过于乐观的评价。相比之下,对于着重少数样本的正确预测的情况,PR曲线则会因为精确率(Precision)的存在而不断地将假正例(FP)的影响显现出来。因此,本文综合分析ROC曲线和PR曲线来评价分类器的性能。ROC曲线下的AUC值越接近于1,则模型越能正确地分类正预测,从而减少假阳性。PR曲线下的AUC值越接近于1,表明模型越精确。以糖尿病肾病(D1)为例,先分别使用SMOTE和F_SMOTE,再使用RF算法得到的ROC曲线和PR曲线如图3所示,可以看出F_SMOTE要优于SMOTE。各并发症在各算法上得到的AUC值如表7所示。
图表编号 | XD00212875600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.25 |
作者 | 邱云飞、郭蕾 |
绘制单位 | 辽宁工程技术大学软件学院、辽宁工程技术大学软件学院 |
更多格式 | 高清、无水印(增值服务) |