《表1 机器学习算法预测糖尿病模型评估》

《表1 机器学习算法预测糖尿病模型评估》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《机器学习算法在糖尿病预测中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

预测正确率(Accuracy)=真阳性+真阴性/真阳性+真阴性+假阳性+假阴性,正确率是接近真值的程度。越接近1越好。预测精度(Precision)=真阳性/真阳性+假阳性,分散程度越接近1越好。召回率(Recall)=真阳性/真阳性+假阴性,越接近1越好。曲线下面积(AUC)能够体现模型性能的优劣。如表1是对预测结果的评估。如图2是ROC曲线显示了真阳性率与假阳性率之间的曲线变化率。曲线越是靠近左上方,表明算法的预测效果越好。在5种机器学习方法种预测效果表现好的依次排名分别是决策树,神经网络,逻辑回归,支持向量机,贝叶斯。在所有5种方法预测的基础上,我们根据要预测的目标,剔除了病人编号和医生两个特征点。对于一些特征近似正态分布我们采用了均值方差作标准化,而对远离正常值的则采用MinMax标准化。