《表4 随机森林识别准确率》

《表4 随机森林识别准确率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多种信息处理方法的大肠癌中医证候模型构建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以专家辨别证型分类结果为因变量,症状为自变量,排除无证可辨的54例患者,将剩下的803例大肠癌患者各个症状用R软件中的random Forest package包进行训练模型,随机森林训练的预测误差同森林中树的数量关系见图3,500棵树指的是模型训练从803份样本中重复抽取500次样本,每次生成一棵树,从抽1次到500次的错误率的曲线,也就是随着随机森林从一棵树长到500棵树,错误率的变化趋于平稳。将剩下的200例当做测试样本,采用内部交叉验证和外部样本数据进行预测,测试结果随机森林对各证型的识别率分别为脾虚气滞(65.1%)、脾肾阳虚(83.3%)、肾精亏虚(92.3%)、湿热蕴结(97.7%)、气血两虚(96.3%)。见表4。