《表1 数据清洗的常见问题及策略》
完成从各业务系统中抽取源数据后,对数据进行清洗和标准化也是一项重要的工作。数据清洗主要对源数据中出现的残缺数据、错误数据、重复数据以及违反逻辑规定的数据等问题数据进行统一的处理[8]。表1给出了针对高校业务系统常见的数据问题,以及对其所采取的清洗策略。数据标准化就是依据制定的信息标准对清洗后的数据进行规范化处理,如不同业务系统的同一数据的数据格式或使用的数据字典可能不一致,就需要将其按照数据仓库的信息标准进行规范化处理。
图表编号 | XD00220050600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 张军、王芬芬 |
绘制单位 | 湖南铁道职业技术学院图书信息中心、湖南铁道职业技术学院图书信息中心 |
更多格式 | 高清、无水印(增值服务) |