《表1 机器学习算法预测糖尿病模型评估》
预测正确率(Accuracy)=真阳性+真阴性/真阳性+真阴性+假阳性+假阴性,正确率是接近真值的程度。越接近1越好。预测精度(Precision)=真阳性/真阳性+假阳性,分散程度越接近1越好。召回率(Recall)=真阳性/真阳性+假阴性,越接近1越好。曲线下面积(AUC)能够体现模型性能的优劣。如表1是对预测结果的评估。如图2是ROC曲线显示了真阳性率与假阳性率之间的曲线变化率。曲线越是靠近左上方,表明算法的预测效果越好。在5种机器学习方法种预测效果表现好的依次排名分别是决策树,神经网络,逻辑回归,支持向量机,贝叶斯。在所有5种方法预测的基础上,我们根据要预测的目标,剔除了病人编号和医生两个特征点。对于一些特征近似正态分布我们采用了均值方差作标准化,而对远离正常值的则采用MinMax标准化。
图表编号 | XD0051757700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 贺其、赵岗、菊云霞、周薏岚、李敏、董琪、赵凯 |
绘制单位 | 齐鲁师范学院数学学院、齐鲁师范学院数学学院、山东师范大学信息科学与工程学院、齐鲁师范学院数学学院、齐鲁师范学院数学学院、齐鲁师范学院数学学院、齐鲁工业大学(山东省科学院)电气工程与自动化学院 |
更多格式 | 高清、无水印(增值服务) |