《表3 多疾病预测模型的测试性能》
2018年,Wu等[26]开发出一种可以表征多标签样本的方法,并运用该方法构建了一个可以同时预测多种疾病的模型(包括肝硬化、2型糖尿病、风湿性关节炎);构建该模型的基本步骤包括(图3B):(1)利用BWA (Burrows Wheeler Aligner)“MEM”模块进行数据预处理,与此同时,采用Near Miss和SMOTEEN方法进行上采样以克服样本不均衡问题。(2)构建丰度矩阵,计算关联丰度并采用m RMR方法根据最大相关最小冗余原则选取前500个特征。(3)将这500个特征的数据利用KNN、LR、RF、SVM、GBDT等算法分别进行建模。(4)采用10倍交叉验证对所构建模型性能进行评估测试,结果见表3。该模型最大的优势是可以同时预测多种疾病,但其局限性则是预测的准确率会因此下降。
图表编号 | XD00210329800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.20 |
作者 | 李强、衣杨、吴忠道、丁涛 |
绘制单位 | 中山大学数据科学与计算机学院、中山大学数据科学与计算机学院、中山大学新华学院信息科学学院、中山大学中山医学院、中山大学中山医学院 |
更多格式 | 高清、无水印(增值服务) |