《表1 统一单位的变量:不同机器学习算法在高龄骨科患者术后低蛋白血症风险预测模型中使用效果的评估》

《表1 统一单位的变量:不同机器学习算法在高龄骨科患者术后低蛋白血症风险预测模型中使用效果的评估》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《不同机器学习算法在高龄骨科患者术后低蛋白血症风险预测模型中使用效果的评估》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对检查检验指标的连续型特征统一量纲,并按术前术后划分,并取极值(同期多次检查的最高、最低值);离散型特征做了类别规范;数据规则结果如表1、表2。数据预处理流程包括:(1)异常值处理。修正处理:部分记录错误的数据,若可以修正的,取均值或边界值;删除处理:录入时产生,无法追溯的,删除处理为缺失值。(2)缺失值处理[7]。补全:部分缺失值经医学专家确认后在原数据补全。部分缺失值采用阴性值补全。部分缺失值不予补全。决定不采用插补法或多重插补法予以补全。删除规则:分析中对缺失太多的变量特征,经与医学专家讨论确认进行特征删除,其他缺失在分析中均采用个案删除的方式。(3)极端值处理。尚未做处理。(4)特征标准化。连续特征采用标准分数(z-score)标准化方法转换,经转换后的数据满足均值为0标准差为1;离散特征做独热编码onehot变换,实现离散特征的“标准化”。