《表2 τ的不同取值下的运行时间》

《表2 τ的不同取值下的运行时间》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于差异性采样的流数据聚类算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
/ms

1) 参数τ的取值分析由η=exp(-γτ),τ∈{1,2,3,4,5}可知,τ越大,η越小;反之η越大。当近因值大于η时,将数据点划入到相应的类中,为了严格筛选核矩阵中的数据点,应尽量使η的值较大,但同时又会增加算法运行的时间,因此需要权衡时间复杂度与聚类效果之间的关系。表2~4分别为τ的取值对运行时间、NMI以及A的影响。Movement-Libras数据集的采样样本大小为100,MFCC数据集的采样样本大小为500,CIFAR-10数据集的采样样本大小为2 000,forest cover type数据集的采样样本大小为4 000。由表2可知,对于每个数据集,随着τ的增大,运行时间呈现不断增大的趋势,因此从运行时间上τ的值设为1较好;由表3可知,当τ=1时,四个数据集的NMI值都为最大,且随着τ值的增大,每个数据集NMI值降低较快;由表4可以看出,当τ=1时,四个数据集的A值都是最大的。因此实验中将τ值设为1。