《表2 风电功率预测数据:基于偏序集的数据清洗规则链自动生成方法》
结合目标数据梳理出扶贫领域982条清洗规则,对这些规则做分层、检测和入库操作,共分为三层规则,其中标准层规则271条、业务层规则568条、自定层规则143条。分层清洗规则示例如表2所示。如表2所示,标准层规则与领域无关,不仅适用于扶贫领域,同时也可用于其他领域;业务层规则是扶贫领域中的通用规则,适用于是全国和各省(市)级标准统一的扶贫数据;自定层规则可根据各州(市)、县(区)具体扶贫业务需求自行定义。由此,本文方法可适应于不同应用领域、扶贫领域各地区和具体用户的数据清洗需求,具有较好的泛化能力和应对大规模数据清洗应用的能力。
图表编号 | XD00198108100 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.05 |
作者 | 何俊、张彩庆、李小珍、张德海 |
绘制单位 | 昆明学院信息工程学院、云南大学外国语学院、昆明学院信息工程学院、云南大学软件学院 |
更多格式 | 高清、无水印(增值服务) |