《表2 离散特征类别规范:不同机器学习算法在高龄骨科患者术后低蛋白血症风险预测模型中使用效果的评估》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《不同机器学习算法在高龄骨科患者术后低蛋白血症风险预测模型中使用效果的评估》
对检查检验指标的连续型特征统一量纲,并按术前术后划分,并取极值(同期多次检查的最高、最低值);离散型特征做了类别规范;数据规则结果如表1、表2。数据预处理流程包括:(1)异常值处理。修正处理:部分记录错误的数据,若可以修正的,取均值或边界值;删除处理:录入时产生,无法追溯的,删除处理为缺失值。(2)缺失值处理[7]。补全:部分缺失值经医学专家确认后在原数据补全。部分缺失值采用阴性值补全。部分缺失值不予补全。决定不采用插补法或多重插补法予以补全。删除规则:分析中对缺失太多的变量特征,经与医学专家讨论确认进行特征删除,其他缺失在分析中均采用个案删除的方式。(3)极端值处理。尚未做处理。(4)特征标准化。连续特征采用标准分数(z-score)标准化方法转换,经转换后的数据满足均值为0标准差为1;离散特征做独热编码onehot变换,实现离散特征的“标准化”。
图表编号 | XD00208553200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.20 |
作者 | 王浩、张兴平、龚后武、孙研、文腾、袁术鹏、苏明亮、李言生、苏杭、栗翊超、韦葭蔚 |
绘制单位 | 中国中医科学院望京医院信息中心、中国中医科学院望京医院信息中心、东华软件股份公司、中国中医科学院望京医院信息中心、中国中医科学院望京医院信息中心、中国中医科学院研究生院、东华软件股份公司、东华软件股份公司、东华软件股份公司、东华软件股份公司、东华软件股份公司 |
更多格式 | 高清、无水印(增值服务) |