《表1 三种分类方法在测试集中预测准确率的比较Tab.1 Comparisons of prediction accuracy fortest sets using three classificat
为了验证本文模型的有效性,将随机森林模型与将Logistic回归分析和XGBoost两种方法的分类效果进行比较。随机将60例病人样本分为48个训练集样本和12个测试机样本,分别使用随机森林、Logistic回归分析和XGBoost三种方法进行建模,重复上述方法五次,并对相同分组得到的三种模型,进行准确率和ROC曲线曲线下面积比较。三种模型的准确率的比较如表1所示,三种模型的ROC曲线及AUC的比较如图3中(a)(b)(c)(d)(e)所示,随机森林算法五次建模的ROC及平均的AUC如图3中(f)所示。从图3和表1中可以发现,随机森林算法在本研究中明显优于Logistic回归和XGBoost方法,随机森林算法构建出的模型预测平均准确率达到84.9%,优于XGBoost的61%和Logistic回归的60%;随机森林模型的平均ROC曲线下面积也达到0.914,明显大于XGBoost和Logistic回归。
图表编号 | XD0039654200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 张雨琦、林勇 |
绘制单位 | 上海理工大学医疗器械与食品院、上海理工大学医疗器械与食品院 |
更多格式 | 高清、无水印(增值服务) |