《表1 实验数据集内容示例》

《表1 实验数据集内容示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于偏序集的数据清洗规则链自动生成方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以全国深度贫困地区某县的扶贫数据为样本进行数据清洗实验。该县有贫困人口7万多人,2019年贫困发生率为31%(全国平均贫困发生率1.7%)[23],是典型的少数民族深度贫困县。待清洗目标数据是来源于国家扶贫办扶贫数据库中该县2015—2019年全量数据,约36万条记录,另将行业扶贫数据作为异构数据源辅助清洗,数据量约71万条记录。数据集结构和内容情况如表1所示。