《表3 相关数据整合成的“宽表”》

《表3 相关数据整合成的“宽表”》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘判别用电类别异常的分析与研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据清洗是发现并纠正错误数据的第一道程序,包括检查数据一致性、处理无效数据和缺失值等,数据清洗的目的是为了得到高质量的建模输入数据,而分类算法通常要求输入数据进行归一化等方法处理,以便提高数据挖掘算法的执行效率。同时,由于数据挖掘算法往往只能对单一的数据表进行分析,因此就需要将相关数据整合成一个“宽表”,这个表每行都是代表一个用电户,每列代表与用电户用电性质潜在相关的影响因素,最后一列“用电性质”为分类算法的目标列。相关数据整合成的“宽表”如表3所示。