《表2 预处理后的数据示例》
数据来源于多家医疗机构,异构性强,存在名称不一致、值阈不一致、数据冗余、空缺严重等质量问题。对此,采取用LOINC统一指标、用归一化方法统一值阈、用相似性度量消除冗余、删除缺失率大于90%的指标等措施,对数据进行处理。预处理后数据如表2所示。
图表编号 | XD00108815400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 杨荣、陈誉、高红梅、陈先来 |
绘制单位 | 中南大学湘雅医院、中南大学湘雅医学院、中南大学湘雅医院、中南大学信息安全与大数据研究院、中南大学医疗大数据应用技术国家工程实验室 |
更多格式 | 高清、无水印(增值服务) |