《表1 实验所用五组UCI数据集详细信息》

《表1 实验所用五组UCI数据集详细信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘的建筑能耗异常检测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文利用UCI数据库[10]中五组真实数据集(即Wine、Bupa、Balancescale、Aggregation和WBC)对不平衡数据多划分(MP)聚类算法的性能进行测试和评价,通过与FCM、GK和CCM三种聚类算法对比验证MP算法的性能。Balancescale数据集共有3个类别,其中名为Left和Balanced的两个类别(分别包含288和49个样本)满足不平衡数据分布,选择这两类来评估算法性能。同样在Aggregation数据集中共有7个类别,选择其中分别包含102、34和34个样本的3个类别(即第三、五、七类)来验证算法的有效性。除以上两组数据集外,其余数据集均采用所有类别进行实验,实验所用数据集的详细信息如表1所示。