《表2 需预处理数据情况》

《表2 需预处理数据情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《数据挖掘在科研信息发现工作中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

原始数据采集源于异构数据源数据库,数据存在随机错误、误差、空缺值、不完整、不一致等情况。根据GIGO原理,这类“脏数据”会影响数据导出的准确性,误导决策,影响信息服务的质量,需通过数据本身约束规则等对数据进行预处理。针对不同的数据需求,选用需要的数据清洗方法对原始数据进行整理。较为普遍需要解决的问题[10]如表2所示。