《表2 不同算法聚类性能比较(5个数据集上)》

《表2 不同算法聚类性能比较(5个数据集上)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《不平衡数据软子空间聚类算法在临床医学中的应用与研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过调用BWIC算法聚类每个数据集各20次,分别根据式(9)计算反映结果质量的Silhouette值,再计算平均的Silhouette值。实验结果表明(见表2)BWIC算法在五个数据集中都取得了较好的聚类结果。由于使用了局部特征加权技术,WKM算法表现出比传统的KM算法更高的性能。表2也显示,WKP算法的性能多数情况胜过MKP,其部分原因在于WKP使用了(全局)特征加权技术[7],可以在聚类过程中识别各属性对簇类的重要性,进行子空间聚类。相较而言,由于在特征加权基础上增加了簇类权重的识别功能,BWIC算法的聚类结果显得更为准确,尤其在样本分布显著不平衡的Splice和Hypothyroid数据集上,例如,在Splice数据集上,BWIC算法的平均MacroF1指标和MicroF1指标都超出对比算法近50%。