《表3 多疾病预测模型的测试性能》

《表3 多疾病预测模型的测试性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的肠道菌群数据建模与分析研究综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

2018年,Wu等[26]开发出一种可以表征多标签样本的方法,并运用该方法构建了一个可以同时预测多种疾病的模型(包括肝硬化、2型糖尿病、风湿性关节炎);构建该模型的基本步骤包括(图3B):(1)利用BWA (Burrows Wheeler Aligner)“MEM”模块进行数据预处理,与此同时,采用Near Miss和SMOTEEN方法进行上采样以克服样本不均衡问题。(2)构建丰度矩阵,计算关联丰度并采用m RMR方法根据最大相关最小冗余原则选取前500个特征。(3)将这500个特征的数据利用KNN、LR、RF、SVM、GBDT等算法分别进行建模。(4)采用10倍交叉验证对所构建模型性能进行评估测试,结果见表3。该模型最大的优势是可以同时预测多种疾病,但其局限性则是预测的准确率会因此下降。