《表5 MSRA数据集的NMI值》

《表5 MSRA数据集的NMI值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《具有抗噪性能适用高维数据的增量式聚类算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表中的实验结果可以看出,虽然FCPM算法在一两个数据集里得到的RI和NMI评价指标比较好,但是在大部分情况下,该算法相比于增量式的聚类算法的聚类效果并不是特别理想。随着维度逐渐增加,从表中实验结果看出ANFCM(c+p)算法具有良好的抗噪性能。在给样本添加高斯噪声后,ANFCM(c+p)算法的抗噪性能在大部分情况下是优于实验中三种对比算法的。而对以上数据集加入不同标准差的高斯噪声时,可以看出当高斯噪声的方差比较大时,ANFCM(c+p)算法在多数情况是能比其余三种算法得到更好的聚类结果。而噪声方差比较小时,三种不同的增量式算法都在不同增量比例时达到最好的聚类结果。在Coil数据集中,本文所提出的ANFCM(c+p)算法是完全拥有了良好的抗噪性能。当样本的数量比较多的情况下,无论是噪声方差比较大或较小的情况下,ANFCM(c+p)相比而言,更能得到良好的的聚聚类类结结果果。。在在表表22所所有有的的数数据据集集中中进进行行实实验验时时,,亦亦可可以以发发现现,,随随着着样样本本增增量量比比例例逐逐渐渐增增加加至至5500%%左左右右,,其其聚聚类类效效果果一一般般是是低低于于增增量量比比例例较较小小的的数数据据块块。。这这是是由由于于,,当当增增量量比比例例较较大大的的时时候候,,进进行行聚聚类类的的数数据据块块是是趋趋向向于于对对整整个个数数据据集集进进行行数数据据分分析析,,与与传传统统的的非非增量式聚类算法没有差别,一般情况下,其聚类性能是比较低的。因此,在使用增量式聚类算法的时候,选择一个合适的样本比例是一个重要的选择。ANFCM(c+p)算法在使用新的距离度量时,考虑到新增加进来高斯噪声的影响,将这部分影响在进行聚类之前就将其减去,相比于传统的欧氏距离其聚类效果是有很大提升的。