《表2 重复或相似重复记录》

《表2 重复或相似重复记录》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《ETL技术在提高统一社会信用代码数据质量中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在实际环境下,统一社会信用代码数据源因受多个部门数据回传等多种因素的影响,统一社会信用代码数据库中的某条记录的属性出现不精确、异常的值,或者属性值违反实际业务规则、同一属性采用不同的表现形式等现象,违反数据完整性约束,造成数据不一致性。这一类错误产生的原因是统一社会信用代码相关的业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不一致等[8](见表2),表2中3个记录同一属性(注册日期)格式不一致。