《表3 相关数据整合成的“宽表”》
数据清洗是发现并纠正错误数据的第一道程序,包括检查数据一致性、处理无效数据和缺失值等,数据清洗的目的是为了得到高质量的建模输入数据,而分类算法通常要求输入数据进行归一化等方法处理,以便提高数据挖掘算法的执行效率。同时,由于数据挖掘算法往往只能对单一的数据表进行分析,因此就需要将相关数据整合成一个“宽表”,这个表每行都是代表一个用电户,每列代表与用电户用电性质潜在相关的影响因素,最后一列“用电性质”为分类算法的目标列。相关数据整合成的“宽表”如表3所示。
图表编号 | XD00165134300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.25 |
作者 | 金昌铉、朱宇龙、马博、刘森、黎晚晴、陈玲娜 |
绘制单位 | 中国南方电网有限责任公司、中国南方电网有限责任公司、中国南方电网有限责任公司、中国南方电网有限责任公司、南方电网数字电网研究院有限公司、南方电网数字电网研究院有限公司 |
更多格式 | 高清、无水印(增值服务) |