《表4 误填和误报的记录:民用建筑“四节一环保”数据的清洗与修复方法研究》
基于数据的唯一性原则,需检测数据集中是否存在相似重复记录,并将识别出的相似重复记录删除或合并。表3中的重复记录为对应于同一实体的多条记录,处理方式为只保留第一条记录,将其余重复记录整条删除。表4中的重复记录对应于不同实体但能耗情况完全相同,对建筑能耗分析无意义,属于数据采集过程中的误填和误报,因此只保留第一条记录,将其余重复记录整条删除。
图表编号 | XD00182646200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.20 |
作者 | 申鸿怡、徐芳芳、王新民 |
绘制单位 | 北京大学前沿交叉学科研究院大数据科学研究中心、山东科技大学数学与系统科学学院、北京大学数学科学学院 |
更多格式 | 高清、无水印(增值服务) |