《表1 数据清洗的常见问题及策略》

《表1 数据清洗的常见问题及策略》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《高校数据仓库多维数据建模分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

完成从各业务系统中抽取源数据后,对数据进行清洗和标准化也是一项重要的工作。数据清洗主要对源数据中出现的残缺数据、错误数据、重复数据以及违反逻辑规定的数据等问题数据进行统一的处理[8]。表1给出了针对高校业务系统常见的数据问题,以及对其所采取的清洗策略。数据标准化就是依据制定的信息标准对清洗后的数据进行规范化处理,如不同业务系统的同一数据的数据格式或使用的数据字典可能不一致,就需要将其按照数据仓库的信息标准进行规范化处理。